Αναφορά ειδήσεων Τεχνολογία
23 Μαΐου 2023

Η Meta έχει αναπτύξει ένα ανοιχτού κώδικα ομιλίας AI που αναγνωρίζει πάνω από 4,000 ομιλούμενες γλώσσες

Εν συντομία

Το έργο MMS της εταιρείας μπορεί να αναγνωρίσει περισσότερες από 4,000 γλώσσες.

Όπως τα περισσότερα από τα άλλα δημόσια έργα τεχνητής νοημοσύνης που ανακοινώθηκαν, η Meta μοιράζεται τα μοντέλα και τον κώδικά της για να βοηθήσει στη διατήρηση της γλωσσικής ποικιλομορφίας.

Μέσω αυτής της δουλειάς, ελπίζουν να συνεισφέρουν μια μικρή συμβολή στη διατήρηση της απίστευτης γλωσσικής ποικιλομορφίας του κόσμου.

Meta έχει δημιουργήσει ένα μοντέλο γλώσσας AI που είναι μια αναζωογονητική ανατροπή ChatGPT. Το ανοιχτό κώδικα Έργο MMS έχει δημιουργηθεί για να διατηρήσει τη γλωσσική ποικιλομορφία και να ενθαρρύνει την έρευνα και μπορεί να αναγνωρίσει περισσότερες από 4,000 ομιλούμενες γλώσσες και να παράγει κείμενο (ομιλία) σε περισσότερες από 1,100. Η εταιρεία έχει κυκλοφόρησε δημόσια τα μοντέλα και τον κώδικα του σήμερα για να προωθήσει τους στόχους του.

«Μοιραζόμαστε δημόσια τις δημιουργίες και τον κώδικά μας για να ενθαρρύνουμε άλλους στην ερευνητική κοινότητα να βασιστούν στη δουλειά μας», έγραψε ο Meta. «Μέσα από αυτήν την προσπάθεια, ελπίζουμε να διατηρήσουμε την τεράστια γλωσσική ποικιλία του κόσμου».

Η Meta έχει αναπτύξει ένα ανοιχτού κώδικα ομιλίας AI που αναγνωρίζει πάνω από 4,000 ομιλούμενες γλώσσες

Η δυσκολία εκπαίδευσης των αναγνωριστών ομιλίας και των μοντέλων μετατροπής κειμένου σε ομιλία σε μεγάλες ποσότητες ήχου χωρίς ετικέτες μεταγραφής είναι χαρακτηριστική. Οι ετικέτες είναι κρίσιμες για μάθηση μηχανής, το οποίο μπορεί να αναγνωρίσει και να ταξινομήσει σωστά τα δεδομένα. Ωστόσο, για τις γλώσσες που θα εξαφανιστούν τις επόμενες δεκαετίες, «αυτά τα δεδομένα απλά δεν υπάρχουν», όπως εξηγεί ο Meta.

Ο Meta χρησιμοποίησε ηχογραφήσεις θρησκευτικών κειμένων για τη συλλογή δεδομένων με ασυνήθιστο τρόπο. «Χρησιμοποιήσαμε μεταφράσεις θρησκευτικών κειμένων όπως η Βίβλος, τα οποία έχουν μελετηθεί ευρέως για γλωσσική έρευνα μετάφρασης βασισμένη σε κείμενο σε πολλές γλώσσες, επειδή μεταφράζονται σε πολλές διαφορετικές γλώσσες», ανέφερε η εταιρεία. Εξάγαμε ηχογραφήσεις ανθρώπων που διάβαζαν αυτά τα κείμενα σε διαφορετικές γλώσσες από μεταφράσεις που ήταν διαθέσιμες στο κοινό». Οι ερευνητές του Meta πρόσθεσαν πάνω από 4,000 γλώσσες στο μοντέλο.

Η προσέγγιση ακούγεται σαν μια συνταγή για ένα πολύ προκατειλημμένο μοντέλο τεχνητής νοημοσύνης που ευνοεί τις χριστιανικές κοσμοθεωρίες. Ωστόσο, προτού κοροϊδέψετε την ιδέα, σκεφτείτε την από την οπτική γωνία του Meta: Οι ερευνητές πιστεύουν ότι αυτό συμβαίνει επειδή χρησιμοποιούν μια συνδετική χρονική ταξινόμηση CTC (ή μοντέλο ακολουθίας σε ακολουθία ή τύπου ακολουθίας) που είναι πολύ πιο περιορισμένη σε όρους της υπολογιστικής ισχύος σε σύγκριση με μεγάλα γλωσσικά μοντέλα (γνωστά και ως τύποι ακολουθιών) ή διαδοχικά μοντέλα για την αναγνώριση ομιλίας. Ο Μέτα λέει ότι αυτό δεν οδήγησε σε ανδρική προκατάληψη στις θρησκευτικές ηχογραφήσεις που καταγράφηκαν από τους περισσότερους άνδρες ομιλητές.

Η Meta χρησιμοποίησε το wav2vec 2.0, ένα μοντέλο "αυτοεποπτευόμενης εκμάθησης αναπαράστασης ομιλίας", για να εκπαιδεύσει ένα wav2vec 2.0 μοντέλο ευθυγράμμισης που κάνει τα δεδομένα πιο χρηστικά. Το μοντέλο αυτοεποπτευόμενης ομιλίας που εποπτεύτηκε η Meta από δεδομένα χωρίς ετικέτα οδήγησε σε εξαιρετικά αποτελέσματα. Ο Meta διαπίστωσε ότι τα μαζικά πολύγλωσσα μοντέλα ομιλίας είχαν καλή απόδοση σε σύγκριση με τα υπάρχοντα μοντέλα και κάλυψαν 10 φορές περισσότερες γλώσσες, ιδιαίτερα σε σύγκριση με Whisper - Ακουστικά. Το Meta πέτυχε το μισό ποσοστό λάθους λέξεων, ενώ το Massively Multilingual Speech κάλυψε 11 φορές περισσότερες γλώσσες.

Η Meta λέει ότι τα νέα της μοντέλα ομιλίας σε κείμενο δεν είναι τέλεια. Για παράδειγμα, μπορεί να μεταφράσουν λάθος λέξεις ή φράσεις, κάτι που θα μπορούσε να οδηγήσει σε προσβλητικό ή/και λανθασμένο λόγο, έγραψε η εταιρεία. Η υπεύθυνη ανάπτυξη τεχνολογιών τεχνητής νοημοσύνης πρέπει να επιτευχθεί μέσω της συνεργασίας μεταξύ της κοινότητας της τεχνητής νοημοσύνης.

Καθώς η Meta κυκλοφόρησε MMS για έρευνα ανοιχτού κώδικα, ελπίζει ότι μπορεί να αντιστρέψει την τάση της εξαφάνισης της χρήσης γλώσσας. Σε αυτό το όραμα, η υποστηρικτική τεχνολογία, το TTS, ακόμη και η τεχνολογία εικονικής πραγματικότητας και επαυξημένης πραγματικότητας θα μπορούσαν να επιτρέψουν σε όλους να μιλούν και να μαθαίνουν στη μητρική τους γλώσσα. Δήλωσε: «Οραματιζόμαστε έναν κόσμο όπου η τεχνολογία έχει το αντίθετο αποτέλεσμα, ωθώντας τους ανθρώπους να διατηρήσουν τη γλώσσα τους ζωντανή, καθώς μπορούν να έχουν πρόσβαση στην πληροφορία και να χρησιμοποιούν την τεχνολογία μιλώντας στη γλώσσα που προτιμούν».

  • Πρόσφατα ο Μέτα ανακοίνωσε οικονομικά αποτελέσματα για το πρώτο τρίμηνο του 2023. Παρά τις πρόσφατες προσπάθειες αναδιάρθρωσης, η εταιρεία εξέπληξε τους επενδυτές με μια απροσδόκητη αύξηση των πωλήσεων για το πρώτο τρίμηνο. Οι μετοχές σημείωσαν άνοδο 12% την Τετάρτη.

Διαβάστε περισσότερα σχετικά άρθρα:

Αποποίηση ευθυνών

Σύμφωνα με το Οδηγίες του έργου Trust, σημειώστε ότι οι πληροφορίες που παρέχονται σε αυτήν τη σελίδα δεν προορίζονται και δεν πρέπει να ερμηνεύονται ως νομικές, φορολογικές, επενδυτικές, χρηματοοικονομικές ή οποιαδήποτε άλλη μορφή συμβουλής. Είναι σημαντικό να επενδύσετε μόνο ό,τι έχετε την πολυτέλεια να χάσετε και να αναζητήσετε ανεξάρτητες οικονομικές συμβουλές εάν έχετε οποιεσδήποτε αμφιβολίες. Για περισσότερες πληροφορίες, προτείνουμε να ανατρέξετε στους όρους και τις προϋποθέσεις, καθώς και στις σελίδες βοήθειας και υποστήριξης που παρέχονται από τον εκδότη ή τον διαφημιστή. MetaversePost δεσμεύεται για ακριβείς, αμερόληπτες αναφορές, αλλά οι συνθήκες της αγοράς υπόκεινται σε αλλαγές χωρίς προειδοποίηση.

Σχετικά με το Συγγραφέας

Ο Damir είναι ο αρχηγός της ομάδας, ο διευθυντής προϊόντων και ο συντάκτης στο Metaverse Post, καλύπτοντας θέματα όπως AI/ML, AGI, LLMs, Metaverse και Web3-σχετικά πεδία. Τα άρθρα του προσελκύουν ένα τεράστιο κοινό άνω του ενός εκατομμυρίου χρηστών κάθε μήνα. Φαίνεται να είναι ειδικός με 10ετή εμπειρία στο SEO και το ψηφιακό μάρκετινγκ. Ο Damir έχει αναφερθεί στο Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto και άλλες εκδόσεις. Ταξιδεύει μεταξύ των ΗΑΕ, της Τουρκίας, της Ρωσίας και της ΚΑΚ ως ψηφιακός νομάδας. Ο Damir απέκτησε πτυχίο στη φυσική, το οποίο πιστεύει ότι του έχει δώσει τις δεξιότητες κριτικής σκέψης που απαιτούνται για να είναι επιτυχής στο συνεχώς μεταβαλλόμενο τοπίο του Διαδικτύου. 

Περισσότερα άρθρα
Νταμίρ Γιαλάλοφ
Νταμίρ Γιαλάλοφ

Ο Damir είναι ο αρχηγός της ομάδας, ο διευθυντής προϊόντων και ο συντάκτης στο Metaverse Post, καλύπτοντας θέματα όπως AI/ML, AGI, LLMs, Metaverse και Web3-σχετικά πεδία. Τα άρθρα του προσελκύουν ένα τεράστιο κοινό άνω του ενός εκατομμυρίου χρηστών κάθε μήνα. Φαίνεται να είναι ειδικός με 10ετή εμπειρία στο SEO και το ψηφιακό μάρκετινγκ. Ο Damir έχει αναφερθεί στο Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto και άλλες εκδόσεις. Ταξιδεύει μεταξύ των ΗΑΕ, της Τουρκίας, της Ρωσίας και της ΚΑΚ ως ψηφιακός νομάδας. Ο Damir απέκτησε πτυχίο στη φυσική, το οποίο πιστεύει ότι του έχει δώσει τις δεξιότητες κριτικής σκέψης που απαιτούνται για να είναι επιτυχής στο συνεχώς μεταβαλλόμενο τοπίο του Διαδικτύου. 

Hot Stories
Εγγραφείτε στο ενημερωτικό μας δελτίο.
Τελευταία νέα

Η θεσμική όρεξη αυξάνεται προς τα ETF του Bitcoin εν μέσω αστάθειας

Οι αποκαλύψεις μέσω των καταθέσεων 13F αποκαλύπτουν αξιόλογους θεσμικούς επενδυτές που ασχολούνται με τα Bitcoin ETF, υπογραμμίζοντας την αυξανόμενη αποδοχή του ...

Μάθετε περισσότερα

Έφτασε η ημέρα της ποινής: Η μοίρα της CZ βρίσκεται σε ισορροπία καθώς το δικαστήριο των ΗΠΑ εξετάζει την ένσταση του DOJ

Ο Changpeng Zhao είναι έτοιμος να αντιμετωπίσει την καταδίκη σε αμερικανικό δικαστήριο στο Σιάτλ σήμερα.

Μάθετε περισσότερα
Γίνετε μέλος της Καινοτόμου Τεχνολογικής Κοινότητας μας
Δείτε Περισσότερα
Διάβασε περισσότερα
Το Injective ενώνει τις δυνάμεις του με το AltLayer για να επαναφέρει την ασφάλεια στο inEVM
Business Αναφορά ειδήσεων Τεχνολογία
Το Injective ενώνει τις δυνάμεις του με το AltLayer για να επαναφέρει την ασφάλεια στο inEVM
3 Μαΐου 2024
Η Masa συνεργάζεται με το Teller για να εισαγάγει το MASA Lending Pool, ενεργοποιεί τον βασικό δανεισμό USDC
αγορές Αναφορά ειδήσεων Τεχνολογία
Η Masa συνεργάζεται με το Teller για να εισαγάγει το MASA Lending Pool, ενεργοποιεί τον βασικό δανεισμό USDC
3 Μαΐου 2024
Η Velodrome κυκλοφορεί την έκδοση Superchain Beta τις επόμενες εβδομάδες και επεκτείνεται σε όλες τις OP Stack Layer 2 Blockchains
αγορές Αναφορά ειδήσεων Τεχνολογία
Η Velodrome κυκλοφορεί την έκδοση Superchain Beta τις επόμενες εβδομάδες και επεκτείνεται σε όλες τις OP Stack Layer 2 Blockchains
3 Μαΐου 2024
Η CARV ανακοινώνει συνεργασία με την Aethir για την αποκέντρωση του επιπέδου δεδομένων της και τη διανομή ανταμοιβών
Business Αναφορά ειδήσεων Τεχνολογία
Η CARV ανακοινώνει συνεργασία με την Aethir για την αποκέντρωση του επιπέδου δεδομένων της και τη διανομή ανταμοιβών
3 Μαΐου 2024
CRYPTOMERIA LABS PTE. Ε.Π.Ε.