Αναφορά ειδήσεων Τεχνολογία
Ιανουάριος 18, 2023

Η Microsoft κυκλοφόρησε ένα μοντέλο διάχυσης που μπορεί να δημιουργήσει ένα 3D avatar από μια φωτογραφία ενός ατόμου

Εν συντομία

Μια μόνο 2D εικόνα του προσώπου ενός ατόμου μπορεί να χρησιμοποιηθεί για τη δημιουργία ενός 3D avatar χρησιμοποιώντας την τεχνική μηχανικής εκμάθησης διάχυσης 3D Avatar.

Μπορεί να χρησιμοποιηθεί για να παρέχει μια ρεαλιστική τρισδιάστατη προβολή του ατόμου για παιχνίδια ή άλλες χρήσεις ή για να παρέχει μια εμπειρία εικονικής πραγματικότητας (VR) ή επαυξημένης πραγματικότητας (AR).

Το 3D Avatar Diffusion είναι ένας αλγόριθμος μηχανικής μάθησης που μπορεί να τραβήξει μια μόνο 2D εικόνα ενός ανθρώπινου προσώπου και να δημιουργήσει ένα τρισδιάστατο (3D) avatar. Το avatar μπορεί στη συνέχεια να χρησιμοποιηθεί για τη δημιουργία μιας εμπειρίας εικονικής πραγματικότητας (VR) ή επαυξημένης πραγματικότητας (AR) ή για να παρέχει απλώς μια ρεαλιστική τρισδιάστατη προβολή του ατόμου για παιχνίδια ή άλλους σκοπούς.

Το μοντέλο διάχυσης ήταν αναπτύχθηκε από μια ομάδα ερευνητών της Microsoft Research και περιγράφεται σε μια εργασία που δημοσιεύτηκε στο περιοδικό arXiv.

Η Microsoft κυκλοφόρησε ένα μοντέλο διάχυσης που μπορεί να δημιουργήσει ένα 3D avatar από μια φωτογραφία ενός ατόμου

Το 3D Avatar Diffusion βασίζεται σε έναν τύπο αλγόριθμου μηχανικής μάθησης που ονομάζεται μοντέλο διάχυσης. Τα μοντέλα διάχυσης είναι μοντέλα παραγωγής, που σημαίνει ότι μπορούν να δημιουργήσουν νέα δεδομένα παρόμοια με τα δεδομένα εκπαίδευσης. Μοντέλα διάχυσης έχουν χρησιμοποιηθεί στο παρελθόν για τη δημιουργία τρισδιάστατων εικόνων από εικόνες 3D, αλλά το ADM είναι το πρώτο μοντέλο διάχυσης που μπορεί να δημιουργήσει ένα ρεαλιστικό τρισδιάστατο avatar από μια μεμονωμένη εικόνα 2D.

Για να εκπαιδεύσουν το μοντέλο, οι ερευνητές χρησιμοποίησαν ένα σύνολο δεδομένων με περισσότερα από 200,000 τρισδιάστατα μοντέλα προσώπων. Το σύνολο δεδομένων περιελάμβανε μια μεγάλη ποικιλία προσώπων με διαφορετικούς τόνους δέρματος, χτενίσματα και χαρακτηριστικά προσώπου. Το ADM μπόρεσε τότε να μάθει τη σχέση μεταξύ της 3D εικόνας και του μοντέλου τρισδιάστατου προσώπου και να δημιουργήσει ένα ρεαλιστικό τρισδιάστατο avatar από μια μεμονωμένη 2D εικόνα.

Το μοντέλο μπορεί επίσης να χρησιμοποιηθεί για τη δημιουργία ενός avatar από μια φωτογραφία που έχει ληφθεί από διαφορετική γωνία

Για το εξατομικευμένο 3D avatar, το μοντέλο Rodin προσφέρει χειραγώγηση με καθοδήγηση κειμένου. Η επεξεργασία φυσικής γλώσσας είναι ένας διαισθητικός τρόπος για να αλλάξετε πολλές διαφορετικές λειτουργίες 3D avatar.

Αυτή η μελέτη προτείνει ένα τρισδιάστατο μοντέλο παραγωγής που δημιουργεί αυτόματα τρισδιάστατα ψηφιακά είδωλα που αναπαρίστανται ως πεδία νευρικής ακτινοβολίας χρησιμοποιώντας μοντέλα διάχυσης. Λόγω των απαγορευτικών απαιτήσεων μνήμης και επεξεργασίας που σχετίζονται με το 3D, η δημιουργία των πλούσιων χαρακτηριστικών που είναι απαραίτητες για avatar υψηλής ποιότητας είναι ένα τεράστιο ζήτημα. Οι προγραμματιστές προτείνουν το roll-out diffusion network (Rodin) να αντιμετωπίσει αυτό το ζήτημα.

Όσον αφορά το φύλο, την ηλικία, τη φυλή, την έκφραση, τα αξεσουάρ προσώπου κ.λπ., το μοντέλο παρουσιάζει εξαιρετική ποικιλομορφία γενεών.,

Αυτό το δίκτυο απλώνει πολλούς χάρτες δισδιάστατων χαρακτηριστικών ενός πεδίου νευρικής ακτινοβολίας σε ένα μόνο επίπεδο 2D χαρακτηριστικών, όπου το μοντέλο εκτελεί στη συνέχεια διάχυση με επίγνωση 2D. Το μοντέλο Rodin χρησιμοποιεί συνέλιξη με επίγνωση 3D, η οποία παρακολουθεί τα προβαλλόμενα χαρακτηριστικά στο επίπεδο 3D χαρακτηριστικών σύμφωνα με την αρχική τους σχέση σε 2D, για να παρέχει την πολύ αναγκαία υπολογιστική απόδοση, διατηρώντας παράλληλα την ακεραιότητα της διάχυσης στο 3D.

Διαβάστε περισσότερα για το AI:

Αποποίηση ευθυνών

Σύμφωνα με το Οδηγίες του έργου Trust, σημειώστε ότι οι πληροφορίες που παρέχονται σε αυτήν τη σελίδα δεν προορίζονται και δεν πρέπει να ερμηνεύονται ως νομικές, φορολογικές, επενδυτικές, χρηματοοικονομικές ή οποιαδήποτε άλλη μορφή συμβουλής. Είναι σημαντικό να επενδύσετε μόνο ό,τι έχετε την πολυτέλεια να χάσετε και να αναζητήσετε ανεξάρτητες οικονομικές συμβουλές εάν έχετε οποιεσδήποτε αμφιβολίες. Για περισσότερες πληροφορίες, προτείνουμε να ανατρέξετε στους όρους και τις προϋποθέσεις, καθώς και στις σελίδες βοήθειας και υποστήριξης που παρέχονται από τον εκδότη ή τον διαφημιστή. MetaversePost δεσμεύεται για ακριβείς, αμερόληπτες αναφορές, αλλά οι συνθήκες της αγοράς υπόκεινται σε αλλαγές χωρίς προειδοποίηση.

Σχετικά με το Συγγραφέας

Ο Damir είναι ο αρχηγός της ομάδας, ο διευθυντής προϊόντων και ο συντάκτης στο Metaverse Post, καλύπτοντας θέματα όπως AI/ML, AGI, LLMs, Metaverse και Web3-σχετικά πεδία. Τα άρθρα του προσελκύουν ένα τεράστιο κοινό άνω του ενός εκατομμυρίου χρηστών κάθε μήνα. Φαίνεται να είναι ειδικός με 10ετή εμπειρία στο SEO και το ψηφιακό μάρκετινγκ. Ο Damir έχει αναφερθεί στο Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto και άλλες εκδόσεις. Ταξιδεύει μεταξύ των ΗΑΕ, της Τουρκίας, της Ρωσίας και της ΚΑΚ ως ψηφιακός νομάδας. Ο Damir απέκτησε πτυχίο στη φυσική, το οποίο πιστεύει ότι του έχει δώσει τις δεξιότητες κριτικής σκέψης που απαιτούνται για να είναι επιτυχής στο συνεχώς μεταβαλλόμενο τοπίο του Διαδικτύου. 

Περισσότερα άρθρα
Νταμίρ Γιαλάλοφ
Νταμίρ Γιαλάλοφ

Ο Damir είναι ο αρχηγός της ομάδας, ο διευθυντής προϊόντων και ο συντάκτης στο Metaverse Post, καλύπτοντας θέματα όπως AI/ML, AGI, LLMs, Metaverse και Web3-σχετικά πεδία. Τα άρθρα του προσελκύουν ένα τεράστιο κοινό άνω του ενός εκατομμυρίου χρηστών κάθε μήνα. Φαίνεται να είναι ειδικός με 10ετή εμπειρία στο SEO και το ψηφιακό μάρκετινγκ. Ο Damir έχει αναφερθεί στο Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto και άλλες εκδόσεις. Ταξιδεύει μεταξύ των ΗΑΕ, της Τουρκίας, της Ρωσίας και της ΚΑΚ ως ψηφιακός νομάδας. Ο Damir απέκτησε πτυχίο στη φυσική, το οποίο πιστεύει ότι του έχει δώσει τις δεξιότητες κριτικής σκέψης που απαιτούνται για να είναι επιτυχής στο συνεχώς μεταβαλλόμενο τοπίο του Διαδικτύου. 

Hot Stories
Εγγραφείτε στο ενημερωτικό μας δελτίο.
Τελευταια νεα

Η θεσμική όρεξη αυξάνεται προς τα ETF του Bitcoin εν μέσω αστάθειας

Οι αποκαλύψεις μέσω των καταθέσεων 13F αποκαλύπτουν αξιόλογους θεσμικούς επενδυτές που ασχολούνται με τα Bitcoin ETF, υπογραμμίζοντας την αυξανόμενη αποδοχή του ...

Μάθετε περισσότερα

Έφτασε η ημέρα της ποινής: Η μοίρα της CZ βρίσκεται σε ισορροπία καθώς το δικαστήριο των ΗΠΑ εξετάζει την ένσταση του DOJ

Ο Changpeng Zhao είναι έτοιμος να αντιμετωπίσει την καταδίκη σε αμερικανικό δικαστήριο στο Σιάτλ σήμερα.

Μάθετε περισσότερα
Γίνετε μέλος της Καινοτόμου Τεχνολογικής Κοινότητας μας
Δείτε Περισσότερα
Διάβασε περισσότερα
Zeta Markets Initiates Community Airdrop, Κατανέμει το 1% της προμήθειας Z Token στις Κοινότητες Solana
αγορές Αναφορά ειδήσεων Τεχνολογία
Zeta Markets Initiates Community Airdrop, Κατανέμει το 1% της προμήθειας Z Token στις Κοινότητες Solana
8 Μαΐου 2024
Ψηφιακά ομόλογα βασισμένα σε Blockchain της KfW: Ένα άλμα προς ένα πιο διαφανές και αποτελεσματικό χρηματοπιστωτικό οικοσύστημα
Business λογισμικό Ιστορίες και κριτικές Τεχνολογία
Ψηφιακά ομόλογα βασισμένα σε Blockchain της KfW: Ένα άλμα προς ένα πιο διαφανές και αποτελεσματικό χρηματοπιστωτικό οικοσύστημα
8 Μαΐου 2024
Αναθεωρημένος νόμος δωρεών της Νότιας Κορέας: Είναι ένα βήμα προς τα εμπρός ή προς τα πίσω για την Crypto Philanthropy;
Crypto Wiki Σύνοψη Business αγορές Τεχνολογία
Αναθεωρημένος νόμος δωρεών της Νότιας Κορέας: Είναι ένα βήμα προς τα εμπρός ή προς τα πίσω για την Crypto Philanthropy;
8 Μαΐου 2024
Generative AI το 2024: Αναδυόμενες τάσεις, ανακαλύψεις και μελλοντικές προοπτικές
AI Wiki λογισμικό Ιστορίες και κριτικές Τεχνολογία
Generative AI το 2024: Αναδυόμενες τάσεις, ανακαλύψεις και μελλοντικές προοπτικές
8 Μαΐου 2024
CRYPTOMERIA LABS PTE. Ε.Π.Ε.