O mais recente modelo de IA do Stability AI, Stable Zero123, pode gerar visualizações de objetos 3D de alta qualidade com base em uma única imagem e seu desempenho excede significativamente o modelo da geração anterior Zero123-XL. A melhoria deste modelo reflecte-se principalmente em três aspectos: conjunto de dados de formação optimizado, tecnologia inovadora de "condições elevadas" e um processo de formação 40 vezes mais eficiente. Stable Zero123 foi lançado na plataforma Hugging Face e oferece dois modelos de licenciamento: versão de pesquisa e versão comercial, trazendo novas possibilidades para o campo de geração de objetos 3D. Este artigo explicará em detalhes a tecnologia principal e as perspectivas de aplicação do Stable Zero123.
A Stability AI lançou um novo modelo de IA chamado Stable Zero123, que pode gerar visualizações de objetos 3D de alta qualidade a partir de uma única imagem. O Stable Zero123 supera significativamente seu antecessor Zero123-XL nos resultados produzidos, graças a três inovações principais.
Stable Zero123 usa um conjunto de dados de treinamento rigorosamente selecionado do Objaverse que retém especificamente objetos 3D de alta qualidade. Esta melhoria garante que os objetos 3D gerados sejam mais realistas.
Durante o processo de treinamento e inferência do modelo, o Stable Zero123 utiliza o ângulo estimado da câmera para “condicionamento de elevação”. Essa tecnologia permite que o modelo faça previsões mais precisas e melhore significativamente a qualidade das imagens geradas. O Stable Zero123 também apresenta um conjunto de dados pré-computado e um carregador de dados aprimorado, tornando o treinamento 40 vezes mais eficiente.
O Stable Zero123 está atualmente lançado no Hugging Face para pesquisadores e usuários não comerciais baixarem e experimentarem. Ressalta-se que a utilização deste modelo está sujeita a certas restrições de autorização e está dividido em duas versões: Stable Zero123 e Stable Zero123C. O primeiro contém alguns objetos 3D autorizados pelo CC-BY-NC e só pode ser usado para fins de pesquisa; o último usa apenas objetos autorizados pelo CC-BY e CC0, permitindo que usuários com membros do Stability AI os utilizem comercialmente.
Além disso, o Stable Zero123 também está integrado ao código-fonte aberto threestudio para apoiar pesquisas de código aberto na geração de objetos 3D. Atualmente, a versão simplificada relacionada do processo Stable3D está em visualização privada. Com esta abordagem, os usuários podem aproveitar o Score Distillation Sampling (SDS) para otimizar os campos de radiação neural (NeRF) para construir modelos 3D ricamente texturizados a partir de imagens geradas pelo modelo Stable Zero123.
O lançamento do Stable Zero123 não só traz um progresso tecnológico significativo para o campo da geração de objetos 3D, mas também oferece novas possibilidades para pesquisa e aplicações comerciais.
Blog oficial: https://stability.ai/news/stable-zero123-3d-generation
Destaques:
O Stable Zero123 pode gerar visualizações de objetos 3D de alta qualidade com base em uma única imagem, melhorando significativamente o efeito de geração.
O modelo permite a geração de imagens mais precisas por meio de conjuntos de dados aprimorados e técnicas de condicionamento elevadas.
Stable Zero123 é dividido em versão de pesquisa e versão comercial, esta última requer adesão ao Stability AI.
O surgimento do Stable Zero123 marca um salto significativo na tecnologia de geração de modelos 3D. Seu processo de treinamento eficiente e efeitos de geração de alta qualidade oferecem a possibilidade de mais cenários de aplicação no futuro. Vale a pena aguardar seu desenvolvimento e aplicação em vários campos. .