Rapport de nouvelles Technologie
14 décembre 2023

Stability AI Lance le modèle « Stable Zero123 » capable de générer des objets 3D à partir d'une seule image

En bref

Stability AI a annoncé Stable Zero123, un modèle d'IA génératif capable de créer des images 3D à partir d'images ordinaires.

Stability AI Présente le « modèle stable Zero123 » pour générer des objets 3D à partir d'images uniques

Stability AI — la startup derrière le système d'IA générateur d'images Stable Diffusion, a présenté sa dernière innovation – Stable Zero123. Le modèle d'IA générative formé en interne peut créer des images 3D à partir d'images ordinaires avec une qualité et une efficacité améliorées.

Selon la société, le modèle nouvellement lancé marque une amélioration par rapport à ses prédécesseurs Zero1-to-3 et Zero123-XL, grâce à des ensembles de données et des techniques de formation avancées. Contrairement à ses homologues, Stable Zero123 démontre une compréhension approfondie des objets, produisant de nouvelles vues de qualité sous différents angles.

De l'entreprise blog récents dit que Stable Zero123 est basé sur Stable Diffusion 1.5, utilisant la même quantité de mémoire vidéo à accès aléatoire (VRAM) pour générer une nouvelle vue. Cependant, Stability AI a clairement indiqué que la génération d'objets 3D avec ce modèle nécessite plus de temps et de mémoire, recommandant une VRAM substantielle de 24 Go pour des performances optimales.

Un point important à noter dans l'annonce est que le modèle a été mis à disposition uniquement à des fins non commerciales et de recherche, car l'entreprise vise à promouvoir l'innovation au sein de la communauté scientifique.

La société a annoncé que les chercheurs et les passionnés peuvent désormais accéder à Stable Zero123 sur Étreindre le visage, facilitant l’expérimentation et l’exploration de ses capacités.

Établir de nouvelles normes en 3D génération d'image

Avec Zéro Stable123, Stability AI vise à faire progresser le domaine de l’imagerie générée par ordinateur, en fournissant aux chercheurs un outil pour explorer les possibilités de génération d’images 3D. À cette fin, il a amélioré l'ensemble de données de formation pour Stabile Zero123. Il utilise un ensemble de données de formation filtrées provenant d'Objaverse, en se concentrant uniquement sur la préservation d'objets 3D de haute qualité.

L'entreprise a rendu ces objets avec réalisme, pour surpasser les méthodes précédentes.

Pendant la formation et l'inférence, le modèle d'IA génératif bénéficie du conditionnement en élévation. En fournissant au modèle un angle de caméra estimé, il effectue des prédictions plus éclairées et de meilleure qualité, ce qui se traduit par des résultats visuels supérieurs.

De plus, l'incorporation d'un jeu de données (latences précalculées) et un chargeur de données amélioré, combinés aux deux premiers, ont permis d'accélérer l'efficacité de l'entraînement 40 fois par rapport à son prédécesseur, Zero123-XL.

Pour encourager la recherche ouverte sur la génération d'objets 3D, Stability AI a amélioré le code open source du projet threestudio pour prendre en charge Zero123 et Stable Zero123. Une version simplifiée du processus Stable 3D est actuellement en avant-première privée, utilisant l'échantillonnage par distillation de score (SDS) pour optimiser un champ de radiance neuronale (NeRF) à l'aide de Stable Zero123.

Toutefois, il n’est pas destiné à un usage commercial. La société a souligné qu'il s'agissait d'une publication exclusive à des fins de recherche.

Clause de non-responsabilité 

En ligne avec la Lignes directrices du projet de confiance, veuillez noter que les informations fournies sur cette page ne sont pas destinées à être et ne doivent pas être interprétées comme des conseils juridiques, fiscaux, d'investissement, financiers ou toute autre forme de conseil. Il est important d’investir uniquement ce que vous pouvez vous permettre de perdre et de demander des conseils financiers indépendants en cas de doute. Pour plus d'informations, nous vous suggérons de vous référer aux conditions générales ainsi qu'aux pages d'aide et de support mises à disposition par l'émetteur ou l'annonceur. MetaversePost s'engage à fournir des rapports précis et impartiaux, mais les conditions du marché sont susceptibles de changer sans préavis.

A propos de l'auteur

Kumar est un journaliste technologique expérimenté spécialisé dans les intersections dynamiques de l'IA/ML, de la technologie marketing et des domaines émergents tels que la cryptographie, la blockchain et NFTs. Avec plus de 3 ans d'expérience dans l'industrie, Kumar a fait ses preuves dans l'élaboration de récits convaincants, la conduite d'entretiens perspicaces et la fourniture d'informations complètes. L'expertise de Kumar réside dans la production de contenu à fort impact, notamment des articles, des rapports et des publications de recherche pour des plateformes industrielles de premier plan. Doté d’un ensemble de compétences uniques combinant connaissances techniques et narration, Kumar excelle dans la communication de concepts technologiques complexes à des publics divers de manière claire et engageante.

Plus d'articles
Kumar Gandhar
Kumar Gandhar

Kumar est un journaliste technologique expérimenté spécialisé dans les intersections dynamiques de l'IA/ML, de la technologie marketing et des domaines émergents tels que la cryptographie, la blockchain et NFTs. Avec plus de 3 ans d'expérience dans l'industrie, Kumar a fait ses preuves dans l'élaboration de récits convaincants, la conduite d'entretiens perspicaces et la fourniture d'informations complètes. L'expertise de Kumar réside dans la production de contenu à fort impact, notamment des articles, des rapports et des publications de recherche pour des plateformes industrielles de premier plan. Doté d’un ensemble de compétences uniques combinant connaissances techniques et narration, Kumar excelle dans la communication de concepts technologiques complexes à des publics divers de manière claire et engageante.

Hot Stories
Rejoignez notre newsletter.
Dernières infos

De Ripple au Big Green DAO : comment les projets de crypto-monnaie contribuent à la charité

Explorons les initiatives exploitant le potentiel des monnaies numériques pour des causes caritatives.

En savoir plus

AlphaFold 3, Med-Gemini et autres : la façon dont l'IA transforme les soins de santé en 2024

L'IA se manifeste de diverses manières dans le domaine des soins de santé, de la découverte de nouvelles corrélations génétiques à l'autonomisation des systèmes chirurgicaux robotisés...

En savoir plus
Rejoignez notre communauté technologique innovante
En savoir plus
En savoir plus
Vitalik Buterin publie la proposition EIP-7706 visant à introduire un nouveau type de gaz pour les données d'appel de transaction Ethereum
Rapport de nouvelles Technologie
Vitalik Buterin publie la proposition EIP-7706 visant à introduire un nouveau type de gaz pour les données d'appel de transaction Ethereum
14 mai 2024
Le jeton WLD de Worldcoin fera face à une pression de vente agressive avec davantage de déblocages dans les mois à venir, prévient DeFiTrader à 2 bits
Marchés Rapport de nouvelles Technologie
Le jeton WLD de Worldcoin fera face à une pression de vente agressive avec davantage de déblocages dans les mois à venir, prévient DeFiTrader à 2 bits
14 mai 2024
Crypto Exchange Coinbase connaît une panne du système, la société Wile sécurisée des fonds des utilisateurs enquête sur un problème
Marchés Rapport de nouvelles Technologie
Crypto Exchange Coinbase connaît une panne du système, la société Wile sécurisée des fonds des utilisateurs enquête sur un problème
14 mai 2024
De Ripple au Big Green DAO : comment les projets de crypto-monnaie contribuent à la charité
Analyse Crypto Wiki La Brochure Éducation Lifestyle Marchés Logiciels Technologie
De Ripple au Big Green DAO : comment les projets de crypto-monnaie contribuent à la charité
13 mai 2024
CRYPTOMERIA LABS PTE. LTD.