Αναφορά ειδήσεων Τεχνολογία
Μαρτίου 15, 2023

Νέο μοντέλο τεχνητής νοημοσύνης συνθέτει ρεαλιστική ομιλία χρησιμοποιώντας YouTube και Podcast

Εν συντομία

Ερευνητές από το Πανεπιστήμιο Carnegie Mellon δημιούργησαν ένα νέο μοντέλο τεχνητής νοημοσύνης που μπορεί να παράγει ρεαλιστική ομιλία μαθαίνοντας από βίντεο του YouTube και podcasts.

Το μοντέλο μπόρεσε να μάθει τις αποχρώσεις των φυσικών μοτίβων ομιλίας ακούγοντας σχεδόν 900 ώρες περιεχομένου YouTube και podcast, με αποτέλεσμα μια πιο ρεαλιστική και ζωντανή συνθετική φωνή.

Ερευνητές από το Πανεπιστήμιο Carnegie Mellon των Η.Π.Α έχει δημιουργήσει ένα νέο μοντέλο τεχνητής νοημοσύνης που μπορεί να παράγει ρεαλιστική ομιλία μαθαίνοντας από βίντεο και podcast του YouTube. Το μοντέλο είναι ικανό να παράγει ομιλία με ποικίλες φωνές και τόνους, καθιστώντας το ένα δυνητικά χρήσιμο εργαλείο για βιομηχανίες όπως η ψυχαγωγία και η διαφήμιση. Θα μπορούσε επίσης να έχει συνέπειες για όσους βασίζονται στην υποστηρικτική τεχνολογία για την επικοινωνία.

Ένα νέο μοντέλο AI συνθέτει ρεαλιστική ομιλία χρησιμοποιώντας το YouTube και τα podcast
Το μοντέλο AI είναι ικανό να μιμείται μοτίβα ανθρώπινης ομιλίας και τονισμούς με υψηλή ακρίβεια.

Αυτή είναι μια σημαντική εξέλιξη, καθώς η πλειονότητα της ομιλίας που δημιουργείται από AI έχει βρεθεί ότι είναι χωρίς συναισθήματα και μονότονη λόγω του γεγονότος ότι συνήθως εκπαιδεύεται σε σύνολα δεδομένων όπου καταγράφεται η ομιλία επαγγελματιών ηθοποιών. Η νέα τεχνολογία μπορεί να χρησιμοποιηθεί για τη βελτίωση της απόδοσης των εικονικών βοηθών και των chatbot, καθιστώντας τα πιο ελκυστικά και ανθρώπινα. Έχει επίσης πιθανές εφαρμογές σε τομείς όπως το παιχνίδι, η εκπαίδευση και η ψυχαγωγία.

Διαβάστε περισσότερα: 15 Καλύτερα Crypto Podcasts που πρέπει να ακούσετε το 2023

Το νέο μοντέλο, ωστόσο, μπόρεσε να μάθει τις αποχρώσεις των φυσικών προτύπων ομιλίας, όπως παύσεις, παρεμβολές και παρασιτικές λέξεις, ακούγοντας σχεδόν 900 ώρες περιεχομένου YouTube και podcast. Αυτό είχε ως αποτέλεσμα μια πιο ρεαλιστική και ζωντανή συνθετική φωνή, η οποία βαθμολογήθηκε με 3.89 σε μια κλίμακα πέντε βαθμών από άτομα που κλήθηκαν να την αξιολογήσουν. Αυτό είναι υψηλότερο από τη μέση βαθμολογία που λαμβάνουν παρόμοια μοντέλα AI (μια πραγματική ανθρώπινη φωνή βαθμολογείται με 4.01).

Οι πιθανές εφαρμογές αυτής της τεχνολογίας είναι τεράστιες και περιλαμβάνουν τη βοήθεια ατόμων με προβλήματα ομιλίας, τη βελτίωση των συστημάτων πλοήγησης και τη δημιουργία εικονικών βοηθών με περισσότερο φυσικό ήχο.

  • PodcastAI είναι το πρώτο podcast που παρήχθη ποτέ από την AI, με μια πλαστή του Joe Rogan να παίρνει συνέντευξη από τον Steve Jobs. Αυτό το podcast είναι κατασκευασμένο εξ ολοκλήρου από αλγόριθμους υπολογιστών AI. Το AI εκπαιδεύτηκε για το επεισόδιο του Steve Jobs χρησιμοποιώντας τόσο τη βιογραφία του όσο και οποιαδήποτε ηχογράφηση του στο Διαδίκτυο μπορούσε να ανακαλύψει. Αυτό επέτρεψε στο AI να αναδημιουργήσει πιστά την προσωπικότητά του.

Διαβάστε περισσότερα σχετικά άρθρα:

Αποποίηση ευθυνών

Σύμφωνα με το Οδηγίες του έργου Trust, σημειώστε ότι οι πληροφορίες που παρέχονται σε αυτήν τη σελίδα δεν προορίζονται και δεν πρέπει να ερμηνεύονται ως νομικές, φορολογικές, επενδυτικές, χρηματοοικονομικές ή οποιαδήποτε άλλη μορφή συμβουλής. Είναι σημαντικό να επενδύσετε μόνο ό,τι έχετε την πολυτέλεια να χάσετε και να αναζητήσετε ανεξάρτητες οικονομικές συμβουλές εάν έχετε οποιεσδήποτε αμφιβολίες. Για περισσότερες πληροφορίες, προτείνουμε να ανατρέξετε στους όρους και τις προϋποθέσεις, καθώς και στις σελίδες βοήθειας και υποστήριξης που παρέχονται από τον εκδότη ή τον διαφημιστή. MetaversePost δεσμεύεται για ακριβείς, αμερόληπτες αναφορές, αλλά οι συνθήκες της αγοράς υπόκεινται σε αλλαγές χωρίς προειδοποίηση.

Σχετικά με το Συγγραφέας

Ο Damir είναι ο αρχηγός της ομάδας, ο διευθυντής προϊόντων και ο συντάκτης στο Metaverse Post, καλύπτοντας θέματα όπως AI/ML, AGI, LLMs, Metaverse και Web3-σχετικά πεδία. Τα άρθρα του προσελκύουν ένα τεράστιο κοινό άνω του ενός εκατομμυρίου χρηστών κάθε μήνα. Φαίνεται να είναι ειδικός με 10ετή εμπειρία στο SEO και το ψηφιακό μάρκετινγκ. Ο Damir έχει αναφερθεί στο Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto και άλλες εκδόσεις. Ταξιδεύει μεταξύ των ΗΑΕ, της Τουρκίας, της Ρωσίας και της ΚΑΚ ως ψηφιακός νομάδας. Ο Damir απέκτησε πτυχίο στη φυσική, το οποίο πιστεύει ότι του έχει δώσει τις δεξιότητες κριτικής σκέψης που απαιτούνται για να είναι επιτυχής στο συνεχώς μεταβαλλόμενο τοπίο του Διαδικτύου. 

Περισσότερα άρθρα
Νταμίρ Γιαλάλοφ
Νταμίρ Γιαλάλοφ

Ο Damir είναι ο αρχηγός της ομάδας, ο διευθυντής προϊόντων και ο συντάκτης στο Metaverse Post, καλύπτοντας θέματα όπως AI/ML, AGI, LLMs, Metaverse και Web3-σχετικά πεδία. Τα άρθρα του προσελκύουν ένα τεράστιο κοινό άνω του ενός εκατομμυρίου χρηστών κάθε μήνα. Φαίνεται να είναι ειδικός με 10ετή εμπειρία στο SEO και το ψηφιακό μάρκετινγκ. Ο Damir έχει αναφερθεί στο Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto και άλλες εκδόσεις. Ταξιδεύει μεταξύ των ΗΑΕ, της Τουρκίας, της Ρωσίας και της ΚΑΚ ως ψηφιακός νομάδας. Ο Damir απέκτησε πτυχίο στη φυσική, το οποίο πιστεύει ότι του έχει δώσει τις δεξιότητες κριτικής σκέψης που απαιτούνται για να είναι επιτυχής στο συνεχώς μεταβαλλόμενο τοπίο του Διαδικτύου. 

Hot Stories
Εγγραφείτε στο ενημερωτικό μας δελτίο.
Τελευταία νέα

The DOGE Frenzy: Analysing the Dogecoin's (DOGE) Recent Surge in Value

Ο κλάδος των κρυπτονομισμάτων επεκτείνεται γρήγορα και τα meme coins προετοιμάζονται για μια σημαντική άνοδο. Dogecoin (DOGE), ...

Μάθετε περισσότερα

Η εξέλιξη του περιεχομένου που δημιουργείται από AI στο Metaverse

Η εμφάνιση του παραγωγικού περιεχομένου AI είναι μια από τις πιο συναρπαστικές εξελίξεις στο εικονικό περιβάλλον ...

Μάθετε περισσότερα
Γίνετε μέλος της Καινοτόμου Τεχνολογικής Κοινότητας μας
Δείτε Περισσότερα
Διάβασε περισσότερα
Το Scroll ολοκληρώνει την αναβάθμιση Bernoulli Mainnet, αναμένει μείωση 10 φορές στο κόστος συναλλαγής
Αναφορά ειδήσεων Τεχνολογία
Το Scroll ολοκληρώνει την αναβάθμιση Bernoulli Mainnet, αναμένει μείωση 10 φορές στο κόστος συναλλαγής
Απρίλιος 29, 2024
Το OKX Jumpstart Lists Runecoin, Επιτρέπει το ποντάρισμα BTC για να κερδίσετε κουπόνια RUNE
αγορές Αναφορά ειδήσεων Τεχνολογία
Το OKX Jumpstart Lists Runecoin, Επιτρέπει το ποντάρισμα BTC για να κερδίσετε κουπόνια RUNE
Απρίλιος 29, 2024
Οι κορυφαίες προσφορές αυτής της εβδομάδας, σημαντικές επενδύσεις σε τεχνητή νοημοσύνη, πληροφορική, Web3και Crypto (22-26.04)
Σύνοψη Business αγορές Τεχνολογία
Οι κορυφαίες προσφορές αυτής της εβδομάδας, σημαντικές επενδύσεις σε τεχνητή νοημοσύνη, πληροφορική, Web3και Crypto (22-26.04)
Απρίλιος 26, 2024
Vitalik Buterin Σχόλια σχετικά με τη συγκέντρωση του PoW, σημειώνει ότι ήταν προσωρινό στάδιο μέχρι το PoS
Αναφορά ειδήσεων Τεχνολογία
Vitalik Buterin Σχόλια σχετικά με τη συγκέντρωση του PoW, σημειώνει ότι ήταν προσωρινό στάδιο μέχρι το PoS
Απρίλιος 26, 2024
CRYPTOMERIA LABS PTE. Ε.Π.Ε.