Αναφορά ειδήσεων Τεχνολογία
Ιούνιος 26, 2023

Η Google παρουσιάζει το AudioPaLM, ένα ισχυρό μοντέλο γλώσσας AI για τη δημιουργία ομιλίας

Εν συντομία

Το AudioPaLM είναι ένα ισχυρό μοντέλο γλώσσας που αναπτύχθηκε από Google που συνδυάζει μοντέλα που βασίζονται σε κείμενο και ομιλία για απρόσκοπτη επεξεργασία ομιλίας και κειμένου.

Διατηρεί παραγλωσσικές πληροφορίες και ξεπερνά τα υπάρχοντα συστήματα στις εργασίες μετάφρασης ομιλίας.

Το AudioPaLM μπορεί να μεταφράσει γλώσσες με τόνο και να εκτελεί μεταφορές φωνής για μετάφραση ομιλίας σε ομιλία.

Η Google αποκάλυψε ένα μοντέλο γλώσσας που ονομάζεται AudioPaLM, το οποίο συνδυάζει μοντέλα γλώσσας που βασίζονται σε κείμενο και ομιλία για την απρόσκοπτη επεξεργασία και δημιουργία ομιλίας και κειμένου. Με τη συγχώνευση των δυνατοτήτων του PalM-2 και AudioLM, το AudioPaLM προσφέρει μια ενοποιημένη πολυτροπική αρχιτεκτονική που ανοίγει ένα ευρύ φάσμα εφαρμογών, συμπεριλαμβανομένης της αναγνώρισης ομιλίας και της μετάφρασης ομιλίας σε ομιλία.

Η Google παρουσιάζει το AudioPaLM, ένα ισχυρό μοντέλο γλώσσας για τη δημιουργία ομιλίας
πίστωσης: Metaverse Post (mpost.io)

Ένα αξιοσημείωτο χαρακτηριστικό του AudioPaLM είναι η ικανότητά του να διατηρεί παραγλωσσικές πληροφορίες όπως η ταυτότητα και ο τονισμός του ομιλητή, χάρη στην επιρροή του AudioLM. Ταυτόχρονα, αξιοποιεί τη γλωσσική γνώση που βρίσκεται σε μοντέλα γλώσσας που βασίζονται σε κείμενο όπως το PaLM-2. Αρχικοποιώντας το AudioPaLM με τα βάρη ενός μοντέλου μεγάλης γλώσσας μόνο κειμένου, το μοντέλο υπερέχει στην επεξεργασία ομιλίας, εκμεταλλευόμενο τα εκτεταμένα δεδομένα εκπαίδευσης κειμένου που χρησιμοποιούνται στην προεκπαίδευση.

Οι αξιοσημείωτες δυνατότητες του AudioPaLM έχουν αποδειχθεί μέσα από διάφορα πειράματα. Έχει ξεπεράσει τα υπάρχοντα συστήματα σε εργασίες μετάφρασης ομιλίας και επιδεικνύει την ικανότητα εκτέλεσης μηδενικής λήψης μετάφραση ομιλίας σε κείμενο για γλώσσες που δεν συναντώνται κατά τη διάρκεια της εκπαίδευσης.

Επιπλέον, το AudioPaLM παρουσιάζει χαρακτηριστικά του μοντέλα γλώσσας ήχου μεταφέροντας φωνές σε διάφορες γλώσσες με βάση σύντομες προφορικές προτροπές.

Η Google έφτιαξε παραδείγματα των δυνατοτήτων του AudioPaLM διαθέσιμο για εξερεύνηση. Η ικανότητα του μοντέλου να μεταφράζει γλώσσες με ξεχωριστές προφορές, όπως τα ιταλικά και τα γερμανικά, έχει κεντρίσει το ενδιαφέρον τόσο στους ερευνητές όσο και στους χρήστες. Επιπλέον, η ικανότητά του να εκτελεί μεταφορές φωνής για μετάφραση ομιλίας σε ομιλία το ξεχωρίζει από τις υπάρχουσες γραμμές βάσης, όπως επιβεβαιώνεται τόσο από τις αυτόματες μετρήσεις όσο και από τους ανθρώπινους αξιολογητές.

Το μοντέλο είναι πολύ καλό στη μετάφραση μιας γλώσσας από ήχο σε ήχο σε άλλη γλώσσα, διατηρώντας τη φωνή και τα συναισθήματα ενός ατόμου. Είναι ενδιαφέρον ότι κατά τη μετάφραση ορισμένων γλωσσών όπως τα ιταλικά και τα γερμανικά, το μοντέλο έχει μια αξιοσημείωτη προφορά και όταν μεταφράζει άλλες, για παράδειγμα, γαλλικά, μιλάει με τέλεια αμερικανική προφορά.

Το μοντέλο AudioPaLM με παραδείγματα μετάφρασης ομιλίας σε ομιλία και αυτόματης αναγνώρισης ομιλίας.

Διαβάστε περισσότερα για το AI:

Αποποίηση ευθυνών

Σύμφωνα με το Οδηγίες του έργου Trust, σημειώστε ότι οι πληροφορίες που παρέχονται σε αυτήν τη σελίδα δεν προορίζονται και δεν πρέπει να ερμηνεύονται ως νομικές, φορολογικές, επενδυτικές, χρηματοοικονομικές ή οποιαδήποτε άλλη μορφή συμβουλής. Είναι σημαντικό να επενδύσετε μόνο ό,τι έχετε την πολυτέλεια να χάσετε και να αναζητήσετε ανεξάρτητες οικονομικές συμβουλές εάν έχετε οποιεσδήποτε αμφιβολίες. Για περισσότερες πληροφορίες, προτείνουμε να ανατρέξετε στους όρους και τις προϋποθέσεις, καθώς και στις σελίδες βοήθειας και υποστήριξης που παρέχονται από τον εκδότη ή τον διαφημιστή. MetaversePost δεσμεύεται για ακριβείς, αμερόληπτες αναφορές, αλλά οι συνθήκες της αγοράς υπόκεινται σε αλλαγές χωρίς προειδοποίηση.

Σχετικά με το Συγγραφέας

Ο Damir είναι ο αρχηγός της ομάδας, ο διευθυντής προϊόντων και ο συντάκτης στο Metaverse Post, καλύπτοντας θέματα όπως AI/ML, AGI, LLMs, Metaverse και Web3-σχετικά πεδία. Τα άρθρα του προσελκύουν ένα τεράστιο κοινό άνω του ενός εκατομμυρίου χρηστών κάθε μήνα. Φαίνεται να είναι ειδικός με 10ετή εμπειρία στο SEO και το ψηφιακό μάρκετινγκ. Ο Damir έχει αναφερθεί στο Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto και άλλες εκδόσεις. Ταξιδεύει μεταξύ των ΗΑΕ, της Τουρκίας, της Ρωσίας και της ΚΑΚ ως ψηφιακός νομάδας. Ο Damir απέκτησε πτυχίο στη φυσική, το οποίο πιστεύει ότι του έχει δώσει τις δεξιότητες κριτικής σκέψης που απαιτούνται για να είναι επιτυχής στο συνεχώς μεταβαλλόμενο τοπίο του Διαδικτύου. 

Περισσότερα άρθρα
Νταμίρ Γιαλάλοφ
Νταμίρ Γιαλάλοφ

Ο Damir είναι ο αρχηγός της ομάδας, ο διευθυντής προϊόντων και ο συντάκτης στο Metaverse Post, καλύπτοντας θέματα όπως AI/ML, AGI, LLMs, Metaverse και Web3-σχετικά πεδία. Τα άρθρα του προσελκύουν ένα τεράστιο κοινό άνω του ενός εκατομμυρίου χρηστών κάθε μήνα. Φαίνεται να είναι ειδικός με 10ετή εμπειρία στο SEO και το ψηφιακό μάρκετινγκ. Ο Damir έχει αναφερθεί στο Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto και άλλες εκδόσεις. Ταξιδεύει μεταξύ των ΗΑΕ, της Τουρκίας, της Ρωσίας και της ΚΑΚ ως ψηφιακός νομάδας. Ο Damir απέκτησε πτυχίο στη φυσική, το οποίο πιστεύει ότι του έχει δώσει τις δεξιότητες κριτικής σκέψης που απαιτούνται για να είναι επιτυχής στο συνεχώς μεταβαλλόμενο τοπίο του Διαδικτύου. 

Hot Stories
Εγγραφείτε στο ενημερωτικό μας δελτίο.
Τελευταια νεα

Η θεσμική όρεξη αυξάνεται προς τα ETF του Bitcoin εν μέσω αστάθειας

Οι αποκαλύψεις μέσω των καταθέσεων 13F αποκαλύπτουν αξιόλογους θεσμικούς επενδυτές που ασχολούνται με τα Bitcoin ETF, υπογραμμίζοντας την αυξανόμενη αποδοχή του ...

Μάθετε περισσότερα

Έφτασε η ημέρα της ποινής: Η μοίρα της CZ βρίσκεται σε ισορροπία καθώς το δικαστήριο των ΗΠΑ εξετάζει την ένσταση του DOJ

Ο Changpeng Zhao είναι έτοιμος να αντιμετωπίσει την καταδίκη σε αμερικανικό δικαστήριο στο Σιάτλ σήμερα.

Μάθετε περισσότερα
Γίνετε μέλος της Καινοτόμου Τεχνολογικής Κοινότητας μας
Διαβάστε Περισσότερα
Διάβασε περισσότερα
Πρωτόκολλο υποδομής που λειτουργεί με ZKP Η ZKBase αποκαλύπτει οδικό χάρτη, σχεδιάζει να κυκλοφορήσει το Testnet τον Μάιο
Αναφορά ειδήσεων Τεχνολογία
Πρωτόκολλο υποδομής που λειτουργεί με ZKP Η ZKBase αποκαλύπτει οδικό χάρτη, σχεδιάζει να κυκλοφορήσει το Testnet τον Μάιο
9 Μαΐου 2024
BLOCKCHANCE και CONF3RENCE Ενώνονται για το μεγαλύτερο της Γερμανίας Web3 Συνέδριο στο Ντόρτμουντ
Business αγορές λογισμικό Ιστορίες και κριτικές Τεχνολογία
BLOCKCHANCE και CONF3RENCE Ενώνονται για το μεγαλύτερο της Γερμανίας Web3 Συνέδριο στο Ντόρτμουντ
9 Μαΐου 2024
Το NuLink εκκινεί στο Bybit Web3 Πλατφόρμα IDO. Παρατείνεται η φάση της συνδρομής έως τις 13 Μαΐου
αγορές Αναφορά ειδήσεων Τεχνολογία
Το NuLink εκκινεί στο Bybit Web3 Πλατφόρμα IDO. Παρατείνεται η φάση της συνδρομής έως τις 13 Μαΐου
9 Μαΐου 2024
Η UXLINK και η Binance συνεργάζονται σε νέα καμπάνια, προσφέροντας στους χρήστες 20 εκατομμύρια πόντους UXUY και Airdrop Ανταμοιβές
αγορές Αναφορά ειδήσεων Τεχνολογία
Η UXLINK και η Binance συνεργάζονται σε νέα καμπάνια, προσφέροντας στους χρήστες 20 εκατομμύρια πόντους UXUY και Airdrop Ανταμοιβές
9 Μαΐου 2024
CRYPTOMERIA LABS PTE. Ε.Π.Ε.