Η Microsoft κυκλοφόρησε ένα μοντέλο διάχυσης που μπορεί να δημιουργήσει ένα 3D avatar από μια φωτογραφία ενός ατόμου
Εν συντομία
Μια μόνο 2D εικόνα του προσώπου ενός ατόμου μπορεί να χρησιμοποιηθεί για τη δημιουργία ενός 3D avatar χρησιμοποιώντας την τεχνική μηχανικής εκμάθησης διάχυσης 3D Avatar.
Μπορεί να χρησιμοποιηθεί για να παρέχει μια ρεαλιστική τρισδιάστατη προβολή του ατόμου για παιχνίδια ή άλλες χρήσεις ή για να παρέχει μια εμπειρία εικονικής πραγματικότητας (VR) ή επαυξημένης πραγματικότητας (AR).
Το 3D Avatar Diffusion είναι ένας αλγόριθμος μηχανικής μάθησης που μπορεί να τραβήξει μια μόνο 2D εικόνα ενός ανθρώπινου προσώπου και να δημιουργήσει ένα τρισδιάστατο (3D) avatar. Το avatar μπορεί στη συνέχεια να χρησιμοποιηθεί για τη δημιουργία μιας εμπειρίας εικονικής πραγματικότητας (VR) ή επαυξημένης πραγματικότητας (AR) ή για να παρέχει απλώς μια ρεαλιστική τρισδιάστατη προβολή του ατόμου για παιχνίδια ή άλλους σκοπούς.
Το μοντέλο διάχυσης ήταν αναπτύχθηκε από μια ομάδα ερευνητών της Microsoft Research και περιγράφεται σε μια εργασία που δημοσιεύτηκε στο περιοδικό arXiv.
Το 3D Avatar Diffusion βασίζεται σε έναν τύπο αλγόριθμου μηχανικής μάθησης που ονομάζεται μοντέλο διάχυσης. Τα μοντέλα διάχυσης είναι μοντέλα παραγωγής, που σημαίνει ότι μπορούν να δημιουργήσουν νέα δεδομένα παρόμοια με τα δεδομένα εκπαίδευσης. Μοντέλα διάχυσης έχουν χρησιμοποιηθεί στο παρελθόν για τη δημιουργία τρισδιάστατων εικόνων από εικόνες 3D, αλλά το ADM είναι το πρώτο μοντέλο διάχυσης που μπορεί να δημιουργήσει ένα ρεαλιστικό τρισδιάστατο avatar από μια μεμονωμένη εικόνα 2D.
Για να εκπαιδεύσουν το μοντέλο, οι ερευνητές χρησιμοποίησαν ένα σύνολο δεδομένων με περισσότερα από 200,000 τρισδιάστατα μοντέλα προσώπων. Το σύνολο δεδομένων περιελάμβανε μια μεγάλη ποικιλία προσώπων με διαφορετικούς τόνους δέρματος, χτενίσματα και χαρακτηριστικά προσώπου. Το ADM μπόρεσε τότε να μάθει τη σχέση μεταξύ της 3D εικόνας και του μοντέλου τρισδιάστατου προσώπου και να δημιουργήσει ένα ρεαλιστικό τρισδιάστατο avatar από μια μεμονωμένη 2D εικόνα.
Το μοντέλο μπορεί επίσης να χρησιμοποιηθεί για τη δημιουργία ενός avatar από μια φωτογραφία που έχει ληφθεί από διαφορετική γωνία
Αυτή η μελέτη προτείνει ένα τρισδιάστατο μοντέλο παραγωγής που δημιουργεί αυτόματα τρισδιάστατα ψηφιακά είδωλα που αναπαρίστανται ως πεδία νευρικής ακτινοβολίας χρησιμοποιώντας μοντέλα διάχυσης. Λόγω των απαγορευτικών απαιτήσεων μνήμης και επεξεργασίας που σχετίζονται με το 3D, η δημιουργία των πλούσιων χαρακτηριστικών που είναι απαραίτητες για avatar υψηλής ποιότητας είναι ένα τεράστιο ζήτημα. Οι προγραμματιστές προτείνουν το roll-out diffusion network (Rodin) να αντιμετωπίσει αυτό το ζήτημα.
Αυτό το δίκτυο απλώνει πολλούς χάρτες δισδιάστατων χαρακτηριστικών ενός πεδίου νευρικής ακτινοβολίας σε ένα μόνο επίπεδο 2D χαρακτηριστικών, όπου το μοντέλο εκτελεί στη συνέχεια διάχυση με επίγνωση 2D. Το μοντέλο Rodin χρησιμοποιεί συνέλιξη με επίγνωση 3D, η οποία παρακολουθεί τα προβαλλόμενα χαρακτηριστικά στο επίπεδο 3D χαρακτηριστικών σύμφωνα με την αρχική τους σχέση σε 2D, για να παρέχει την πολύ αναγκαία υπολογιστική απόδοση, διατηρώντας παράλληλα την ακεραιότητα της διάχυσης στο 3D.
Διαβάστε περισσότερα για το AI:
Αποποίηση ευθυνών
Σύμφωνα με το Οδηγίες του έργου Trust, σημειώστε ότι οι πληροφορίες που παρέχονται σε αυτήν τη σελίδα δεν προορίζονται και δεν πρέπει να ερμηνεύονται ως νομικές, φορολογικές, επενδυτικές, χρηματοοικονομικές ή οποιαδήποτε άλλη μορφή συμβουλής. Είναι σημαντικό να επενδύσετε μόνο ό,τι έχετε την πολυτέλεια να χάσετε και να αναζητήσετε ανεξάρτητες οικονομικές συμβουλές εάν έχετε οποιεσδήποτε αμφιβολίες. Για περισσότερες πληροφορίες, προτείνουμε να ανατρέξετε στους όρους και τις προϋποθέσεις, καθώς και στις σελίδες βοήθειας και υποστήριξης που παρέχονται από τον εκδότη ή τον διαφημιστή. MetaversePost δεσμεύεται για ακριβείς, αμερόληπτες αναφορές, αλλά οι συνθήκες της αγοράς υπόκεινται σε αλλαγές χωρίς προειδοποίηση.
Σχετικά με το Συγγραφέας
Ο Damir είναι ο αρχηγός της ομάδας, ο διευθυντής προϊόντων και ο συντάκτης στο Metaverse Post, καλύπτοντας θέματα όπως AI/ML, AGI, LLMs, Metaverse και Web3-σχετικά πεδία. Τα άρθρα του προσελκύουν ένα τεράστιο κοινό άνω του ενός εκατομμυρίου χρηστών κάθε μήνα. Φαίνεται να είναι ειδικός με 10ετή εμπειρία στο SEO και το ψηφιακό μάρκετινγκ. Ο Damir έχει αναφερθεί στο Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto και άλλες εκδόσεις. Ταξιδεύει μεταξύ των ΗΑΕ, της Τουρκίας, της Ρωσίας και της ΚΑΚ ως ψηφιακός νομάδας. Ο Damir απέκτησε πτυχίο στη φυσική, το οποίο πιστεύει ότι του έχει δώσει τις δεξιότητες κριτικής σκέψης που απαιτούνται για να είναι επιτυχής στο συνεχώς μεταβαλλόμενο τοπίο του Διαδικτύου.
Περισσότερα άρθραΟ Damir είναι ο αρχηγός της ομάδας, ο διευθυντής προϊόντων και ο συντάκτης στο Metaverse Post, καλύπτοντας θέματα όπως AI/ML, AGI, LLMs, Metaverse και Web3-σχετικά πεδία. Τα άρθρα του προσελκύουν ένα τεράστιο κοινό άνω του ενός εκατομμυρίου χρηστών κάθε μήνα. Φαίνεται να είναι ειδικός με 10ετή εμπειρία στο SEO και το ψηφιακό μάρκετινγκ. Ο Damir έχει αναφερθεί στο Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto και άλλες εκδόσεις. Ταξιδεύει μεταξύ των ΗΑΕ, της Τουρκίας, της Ρωσίας και της ΚΑΚ ως ψηφιακός νομάδας. Ο Damir απέκτησε πτυχίο στη φυσική, το οποίο πιστεύει ότι του έχει δώσει τις δεξιότητες κριτικής σκέψης που απαιτούνται για να είναι επιτυχής στο συνεχώς μεταβαλλόμενο τοπίο του Διαδικτύου.