Stability AI Lança modelo 'Stable Zero123' que pode gerar objetos 3D a partir de uma única imagem
Em Breve
Stability AI anunciou o Stable Zero123, um modelo generativo de IA que pode criar imagens 3D a partir de imagens normais.
Stability AI — a startup por trás do sistema de IA de geração de imagens Stable Diffusion, apresentou sua mais recente inovação – Stable Zero123. O modelo generativo de IA treinado internamente pode criar imagens 3D a partir de imagens normais com qualidade e eficiência aprimoradas.
Segundo a empresa, o modelo recém-lançado marca uma melhoria em relação aos seus antecessores Zero1-to-3 e Zero123-XL, devido a conjuntos de dados e técnicas de treinamento avançados. Ao contrário dos seus equivalentes, o Stable Zero123 demonstra uma compreensão profunda dos objetos, produzindo novas visualizações com qualidade de vários ângulos.
A empresa no blog diz que o Stable Zero123 é baseado em Stable Diffusion 1.5, utilizando a mesma quantidade de memória de acesso aleatório de vídeo (VRAM) para gerar uma nova visualização. No entanto, Stability AI deixou claro que a geração de objetos 3D com este modelo exige mais tempo e memória, recomendando uma VRAM substancial de 24 GB para desempenho ideal.
Um ponto importante a destacar no anúncio é que o modelo foi disponibilizado apenas para fins não comerciais e de pesquisa, pois a empresa visa promover a inovação na comunidade científica.
A empresa anunciou que pesquisadores e entusiastas agora podem acessar o Stable Zero123 em Abraçando o rosto, facilitando a experimentação e exploração de suas capacidades.
Definindo novos padrões em 3D geração de imagem
Com Zero123 Estável, Stability AI visa avançar no campo das imagens geradas por computador, fornecendo aos pesquisadores uma ferramenta para explorar as possibilidades de geração de imagens 3D. Para esse fim, aprimorou o conjunto de dados de treinamento do Stabile Zero123. Ele utiliza um conjunto de dados de treinamento filtrado proveniente do Objaverse, concentrando-se exclusivamente na preservação de objetos 3D de alta qualidade.
A empresa renderizou esses objetos com realismo, para superar os métodos anteriores.
Durante o treinamento e a inferência, o modelo generativo de IA se beneficia do condicionamento de elevação. Ao fornecer ao modelo um ângulo de câmera estimado, ele faz previsões mais informadas e de maior qualidade, resultando em resultados visuais superiores.
Além disso, a incorporação de um sistema pré-computado conjunto de dados (latentes pré-computadas) e um carregador de dados aprimorado, combinados com os dois primeiros, levaram a uma aceleração de 40 vezes na eficiência do treinamento em comparação com seu antecessor, Zero123-XL.
Para incentivar a pesquisa aberta na geração de objetos 3D, Stability AI melhorou o código-fonte aberto do projeto threestudio para suportar Zero123 e Stable Zero123. Uma versão simplificada do processo Stable 3D está atualmente em visualização privada, utilizando Score Distillation Sampling (SDS) para otimizar um Neural Radiance Field (NeRF) usando Stable Zero123.
No entanto, não se destina ao uso comercial. A empresa enfatizou que este seria um lançamento exclusivo para fins de pesquisa.
Aviso Legal
Em linha com a Diretrizes do Projeto Trust, observe que as informações fornecidas nesta página não se destinam e não devem ser interpretadas como aconselhamento jurídico, tributário, de investimento, financeiro ou qualquer outra forma. É importante investir apenas o que você pode perder e procurar aconselhamento financeiro independente se tiver alguma dúvida. Para mais informações, sugerimos consultar os termos e condições, bem como as páginas de ajuda e suporte fornecidas pelo emissor ou anunciante. MetaversePost está comprometida com relatórios precisos e imparciais, mas as condições de mercado estão sujeitas a alterações sem aviso prévio.
Sobre o autor
Kumar é um jornalista de tecnologia experiente com especialização nas interseções dinâmicas de IA/ML, tecnologia de marketing e campos emergentes como criptografia, blockchain e NFTS. Com mais de 3 anos de experiência no setor, Kumar estabeleceu um histórico comprovado na elaboração de narrativas convincentes, na condução de entrevistas perspicazes e no fornecimento de insights abrangentes. A experiência de Kumar reside na produção de conteúdo de alto impacto, incluindo artigos, relatórios e publicações de pesquisa para plataformas importantes do setor. Com um conjunto único de habilidades que combina conhecimento técnico e narrativa, Kumar se destaca na comunicação de conceitos tecnológicos complexos para diversos públicos de maneira clara e envolvente.
Mais artigosKumar é um jornalista de tecnologia experiente com especialização nas interseções dinâmicas de IA/ML, tecnologia de marketing e campos emergentes como criptografia, blockchain e NFTS. Com mais de 3 anos de experiência no setor, Kumar estabeleceu um histórico comprovado na elaboração de narrativas convincentes, na condução de entrevistas perspicazes e no fornecimento de insights abrangentes. A experiência de Kumar reside na produção de conteúdo de alto impacto, incluindo artigos, relatórios e publicações de pesquisa para plataformas importantes do setor. Com um conjunto único de habilidades que combina conhecimento técnico e narrativa, Kumar se destaca na comunicação de conceitos tecnológicos complexos para diversos públicos de maneira clara e envolvente.