Nachrichtenbericht Technologie
18. Januar 2023

Microsoft hat ein Verbreitungsmodell veröffentlicht, das einen 3D-Avatar aus einem einzelnen Foto einer Person erstellen kann

In Kürze

Ein einzelnes 2D-Bild des Gesichts einer Person kann verwendet werden, um einen 3D-Avatar unter Verwendung der maschinellen Lerntechnik 3D-Avatar-Diffusion zu erzeugen.

Es kann verwendet werden, um eine realistische 3D-Ansicht der Person für Spiele oder andere Zwecke bereitzustellen, oder um ein Erlebnis der virtuellen Realität (VR) oder der erweiterten Realität (AR) bereitzustellen.

Die 3D-Avatar-Diffusion ist ein maschineller Lernalgorithmus, der ein einzelnes 2D-Bild eines menschlichen Gesichts nehmen und einen dreidimensionalen (3D) Avatar erstellen kann. Der Avatar kann dann verwendet werden, um eine Erfahrung in virtueller Realität (VR) oder erweiterter Realität (AR) zu schaffen oder um einfach eine realistische 3D-Ansicht der Person für Spiele oder andere Zwecke bereitzustellen.

Das Diffusionsmodell war entwickelt von einem Forscherteam von Microsoft Research und wird in einem in der Zeitschrift veröffentlichten Artikel beschrieben arXiv.

Microsoft hat ein Verbreitungsmodell veröffentlicht, das einen 3D-Avatar aus einem einzelnen Foto einer Person erstellen kann

Die 3D-Avatar-Diffusion basiert auf einer Art maschinellem Lernalgorithmus, der als Diffusionsmodell bezeichnet wird. Diffusionsmodelle sind generative Modelle, was bedeutet, dass sie neue Daten generieren können, die den Trainingsdaten ähnlich sind. Diffusionsmodelle wurden zuvor verwendet, um 3D-Bilder aus 2D-Bildern zu erzeugen, aber das ADM ist das erste Diffusionsmodell, das einen realistischen 3D-Avatar aus einem einzigen 2D-Bild erzeugen kann.

Um das Modell zu trainieren, verwendeten die Forscher einen Datensatz von über 200,000 3D-Gesichtsmodellen. Der Datensatz umfasste eine Vielzahl von Gesichtern mit unterschiedlichen Hauttönen, Frisuren und Gesichtszügen. Das ADM war dann in der Lage, die Beziehung zwischen dem 2D-Bild und dem 3D-Gesichtsmodell zu lernen und aus einem einzigen 3D-Bild einen realistischen 2D-Avatar zu generieren.

Das Modell kann auch verwendet werden, um aus einem Foto, das aus einem anderen Blickwinkel aufgenommen wurde, einen Avatar zu generieren

Für den personalisierten 3D-Avatar bietet das Rodin-Modell eine textgeführte Manipulation. Die Bearbeitung in natürlicher Sprache ist eine intuitive Möglichkeit, viele verschiedene 3D-Avatar-Funktionen zu ändern.

Diese Studie schlägt ein generatives 3D-Modell vor, das automatisch digitale 3D-Avatare erstellt, die mithilfe von Diffusionsmodellen als neuronale Strahlungsfelder dargestellt werden. Aufgrund der unerschwinglichen Speicher- und Verarbeitungsanforderungen, die mit 3D verbunden sind, ist das Erstellen der reichhaltigen Funktionen, die für qualitativ hochwertige Avatare erforderlich sind, ein großes Problem. Entwickler schlagen vor, dass das Roll-out-Diffusionsnetzwerk (Rodin) dieses Problem angeht.

In Bezug auf Geschlecht, Alter, Rasse, Gesichtsausdruck, Gesichtsaccessoires usw. weist das Modell eine herausragende Generationenvielfalt auf.​

Dieses Netzwerk rollt zahlreiche 2D-Feature-Maps eines neuralen Strahlungsfelds in eine einzige 2D-Feature-Ebene aus, wo das Modell dann eine 3D-bewusste Diffusion ausführt. Das Rodin-Modell verwendet eine 3D-bewusste Faltung, die projizierte Merkmale in der 2D-Merkmalsebene gemäß ihrer ursprünglichen Beziehung in 3D berücksichtigt, um die dringend benötigte Recheneffizienz bereitzustellen und gleichzeitig die Integrität der Diffusion in 3D aufrechtzuerhalten.

Lesen Sie mehr über KI:

Haftungsausschluss

Im Einklang mit der Richtlinien des Trust-ProjektsBitte beachten Sie, dass die auf dieser Seite bereitgestellten Informationen nicht als Rechts-, Steuer-, Anlage-, Finanz- oder sonstige Beratung gedacht sind und nicht als solche interpretiert werden sollten. Es ist wichtig, nur so viel zu investieren, wie Sie sich leisten können, zu verlieren, und im Zweifelsfall eine unabhängige Finanzberatung einzuholen. Für weitere Informationen empfehlen wir einen Blick auf die Allgemeinen Geschäftsbedingungen sowie die Hilfe- und Supportseiten des Herausgebers oder Werbetreibenden. MetaversePost ist einer genauen, unvoreingenommenen Berichterstattung verpflichtet, die Marktbedingungen können sich jedoch ohne Vorankündigung ändern.

Über den Autor

Damir ist Teamleiter, Produktmanager und Redakteur bei Metaverse Post, behandelt Themen wie KI/ML, AGI, LLMs, Metaverse und Web3-bezogene Felder. Seine Artikel ziehen jeden Monat ein riesiges Publikum von über einer Million Nutzern an. Er scheint ein Experte mit 10 Jahren Erfahrung in SEO und digitalem Marketing zu sein. Damir wurde in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto und andere Publikationen. Als digitaler Nomade reist er zwischen den Vereinigten Arabischen Emiraten, der Türkei, Russland und der GUS. Damir hat einen Bachelor-Abschluss in Physik, der ihm seiner Meinung nach die Fähigkeiten zum kritischen Denken vermittelt hat, die er braucht, um in der sich ständig verändernden Landschaft des Internets erfolgreich zu sein. 

Weitere Artikel
Damir Jalalow
Damir Jalalow

Damir ist Teamleiter, Produktmanager und Redakteur bei Metaverse Post, behandelt Themen wie KI/ML, AGI, LLMs, Metaverse und Web3-bezogene Felder. Seine Artikel ziehen jeden Monat ein riesiges Publikum von über einer Million Nutzern an. Er scheint ein Experte mit 10 Jahren Erfahrung in SEO und digitalem Marketing zu sein. Damir wurde in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto und andere Publikationen. Als digitaler Nomade reist er zwischen den Vereinigten Arabischen Emiraten, der Türkei, Russland und der GUS. Damir hat einen Bachelor-Abschluss in Physik, der ihm seiner Meinung nach die Fähigkeiten zum kritischen Denken vermittelt hat, die er braucht, um in der sich ständig verändernden Landschaft des Internets erfolgreich zu sein. 

Angesichts der Volatilität wächst der institutionelle Appetit auf Bitcoin-ETFs

Offenlegungen in 13F-Anmeldungen zeigen, dass namhafte institutionelle Anleger sich mit Bitcoin-ETFs beschäftigen, was die wachsende Akzeptanz von ... unterstreicht.

Weitere Informationen

Der Tag der Verurteilung steht vor der Tür: Das Schicksal von CZ bleibt ungewiss, während das US-Gericht den Plädoyer des DOJ prüft

Changpeng Zhao steht heute vor einer Verurteilung vor einem US-Gericht in Seattle.

Weitere Informationen
Treten Sie unserer innovativen Tech-Community bei
Weiterlesen
Lesen Sie weiter
LD Capital, Antalpha Ventures und Highblock Limited bündeln ihre Kräfte, um einen Hongkonger ETF-Liquiditätsfonds im Wert von 128 Millionen US-Dollar aufzulegen
Geschäft Märkte Nachrichtenbericht
LD Capital, Antalpha Ventures und Highblock Limited bündeln ihre Kräfte, um einen Hongkonger ETF-Liquiditätsfonds im Wert von 128 Millionen US-Dollar aufzulegen
8. Mai 2024
Inside Wall Street Memes (WSM): Enthüllung der Schlagzeilen
Geschäft Märkte Geschichten und Rezensionen Technologie
Inside Wall Street Memes (WSM): Enthüllung der Schlagzeilen
7. Mai 2024
Entdecken Sie Kryptowale: Who is Who auf dem Markt
Geschäft Märkte Geschichten und Rezensionen Technologie
Entdecken Sie Kryptowale: Who is Who auf dem Markt
7. Mai 2024
Orbiter Finance arbeitet mit dem Bitcoin Layer 2 Zulu Network zusammen und stellt es auf dem Is Lwazi Testnet bereit
Geschäft Nachrichtenbericht Technologie
Orbiter Finance arbeitet mit dem Bitcoin Layer 2 Zulu Network zusammen und stellt es auf dem Is Lwazi Testnet bereit 
7. Mai 2024