Nachrichtenbericht Technologie
23. Mai 2023

Meta hat eine Open-Source-Sprach-KI entwickelt, die über 4,000 gesprochene Sprachen erkennt

In Kürze

Das MMS-Projekt des Unternehmens kann über 4,000 Sprachen erkennen.

Wie die meisten seiner anderen öffentlich angekündigten KI-Projekte teilt Meta seine Modelle und seinen Code, um zur Erhaltung der Sprachvielfalt beizutragen.

Durch diese Arbeit hoffen sie, einen kleinen Beitrag zum Erhalt der unglaublichen Sprachenvielfalt der Welt zu leisten.

Meta hat erschaffen ein KI-Sprachmodell, das eine erfrischende Variante darstellt ChatGPT. Die Open-Source MMS-Projekt wurde geschaffen, um die Sprachvielfalt zu bewahren und die Forschung zu fördern. Es kann mehr als 4,000 gesprochene Sprachen erkennen und in über 1,100 Texten (Sprache) produzieren. Das Unternehmen hat öffentlich veröffentlicht seine Modelle und seinen Code heute, um seine Ziele voranzutreiben.

„Wir teilen unsere Kreationen und unseren Code öffentlich, um andere in der Forschungsgemeinschaft zu ermutigen, auf unserer Arbeit aufzubauen“, schrieb Meta. „Durch dieses Unterfangen hoffen wir, die enorme Sprachenvielfalt der Welt zu bewahren.“

Meta hat eine Open-Source-Sprach-KI entwickelt, die über 4,000 gesprochene Sprachen erkennt

Typisch ist die Schwierigkeit, Spracherkenner und Text-zu-Sprache-Modelle auf großen Audiomengen ohne Transkriptionskennzeichnungen zu trainieren. Etiketten sind von entscheidender Bedeutung Maschinelles Lernen, das Daten korrekt identifizieren und klassifizieren kann. Für Sprachen, die in den kommenden Jahrzehnten verschwinden werden, „existieren diese Daten jedoch einfach nicht“, wie Meta erklärt.

Meta nutzte Audioaufnahmen religiöser Texte, um auf unkonventionelle Weise Daten zu sammeln. „Wir haben Übersetzungen religiöser Texte wie der Bibel verwendet, die für die textbasierte Sprachübersetzungsforschung in vielen Sprachen umfassend untersucht wurden, weil sie in viele verschiedene Sprachen übersetzt werden“, sagte das Unternehmen. Wir haben Audioaufnahmen von Menschen, die diese Texte in verschiedenen Sprachen lesen, aus öffentlich zugänglichen Übersetzungen extrahiert.“ Die Forscher von Meta haben über 4,000 Sprachen hinzugefügt Modell.

Der Ansatz klingt wie ein Rezept für ein stark voreingenommenes KI-Modell, das christliche Weltanschauungen bevorzugt. Bevor Sie sich jedoch über die Idee lustig machen, betrachten Sie sie aus der Perspektive von Meta: Forscher glauben, dass dies der Fall ist, weil sie eine konnektionistische zeitliche CTC-Klassifizierung (oder ein Sequenz-zu-Sequenz- oder Sequenztyp-Modell) verwenden, die in ihren Begriffen viel eingeschränkter ist der Rechenleistung im Vergleich zu große Sprachmodelle (auch Sequenztypen genannt) oder sequentielle Modelle für die Spracherkennung. Meta sagt, dass dies nicht zu einer männlichen Voreingenommenheit in den religiösen Aufnahmen geführt habe, die von den meisten männlichen Sprechern aufgenommen wurden.

Meta verwendete wav2vec 2.0, ein „selbstüberwachtes Sprachrepräsentationslernmodell“, um einen wav2vec 2.0 zu trainieren Ausrichtungsmodell Dadurch werden die Daten besser nutzbar. Das selbstüberwachte Sprachmodell, das Meta anhand unbeschrifteter Daten selbst überwachte, führte zu großartigen Ergebnissen. Meta stellte fest, dass die massiv mehrsprachigen Sprachmodelle im Vergleich zu bestehenden Modellen eine gute Leistung erbrachten und zehnmal so viele Sprachen abdeckten, insbesondere im Vergleich zu Flüstern. Meta erreichte die Hälfte der Wortfehlerrate, während Massively Multilingual Speech elfmal so viele Sprachen abdeckte.

Meta sagt, dass seine neuen Speech-to-Text-Modelle nicht perfekt sind. Beispielsweise könnten sie Wörter oder Phrasen falsch übersetzen, was zu einer beleidigenden und/oder falschen Sprache führen könnte, schrieb das Unternehmen. Die verantwortungsvolle Entwicklung von KI-Technologien muss durch die Zusammenarbeit der KI-Community erreicht werden.

Da Meta MMS für die Open-Source-Forschung freigegeben hat, hofft das Unternehmen, den Trend zum Verschwinden des Sprachgebrauchs umkehren zu können. In dieser Vision könnten unterstützende Technologien, TTS und sogar Virtual-Reality- und Augmented-Reality-Technologie es jedem ermöglichen, in seiner Muttersprache zu sprechen und zu lernen. Darin heißt es: „Wir stellen uns eine Welt vor, in der Technologie den gegenteiligen Effekt hat und die Menschen dazu veranlasst, ihre Sprachen am Leben zu erhalten, da sie auf Informationen zugreifen und Technologie nutzen können, indem sie in ihrer bevorzugten Sprache sprechen.“

  • Kürzlich, Meta hat angekündigt, Finanzergebnisse für das erste Quartal 2023. Trotz jüngster Restrukturierungsbemühungen überraschte das Unternehmen die Anleger mit einem unerwarteten Umsatzanstieg im ersten Quartal. Die Aktien stiegen am Mittwoch um 12 %.

Lesen Sie weitere verwandte Artikel:

Haftungsausschluss

Im Einklang mit der Richtlinien des Trust-ProjektsBitte beachten Sie, dass die auf dieser Seite bereitgestellten Informationen nicht als Rechts-, Steuer-, Anlage-, Finanz- oder sonstige Beratung gedacht sind und nicht als solche interpretiert werden sollten. Es ist wichtig, nur so viel zu investieren, wie Sie sich leisten können, zu verlieren, und im Zweifelsfall eine unabhängige Finanzberatung einzuholen. Für weitere Informationen empfehlen wir einen Blick auf die Allgemeinen Geschäftsbedingungen sowie die Hilfe- und Supportseiten des Herausgebers oder Werbetreibenden. MetaversePost ist einer genauen, unvoreingenommenen Berichterstattung verpflichtet, die Marktbedingungen können sich jedoch ohne Vorankündigung ändern.

Über den Autor

Damir ist Teamleiter, Produktmanager und Redakteur bei Metaverse Post, behandelt Themen wie KI/ML, AGI, LLMs, Metaverse und Web3-bezogene Felder. Seine Artikel ziehen jeden Monat ein riesiges Publikum von über einer Million Nutzern an. Er scheint ein Experte mit 10 Jahren Erfahrung in SEO und digitalem Marketing zu sein. Damir wurde in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto und andere Publikationen. Als digitaler Nomade reist er zwischen den Vereinigten Arabischen Emiraten, der Türkei, Russland und der GUS. Damir hat einen Bachelor-Abschluss in Physik, der ihm seiner Meinung nach die Fähigkeiten zum kritischen Denken vermittelt hat, die er braucht, um in der sich ständig verändernden Landschaft des Internets erfolgreich zu sein. 

Weitere Artikel
Damir Jalalow
Damir Jalalow

Damir ist Teamleiter, Produktmanager und Redakteur bei Metaverse Post, behandelt Themen wie KI/ML, AGI, LLMs, Metaverse und Web3-bezogene Felder. Seine Artikel ziehen jeden Monat ein riesiges Publikum von über einer Million Nutzern an. Er scheint ein Experte mit 10 Jahren Erfahrung in SEO und digitalem Marketing zu sein. Damir wurde in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto und andere Publikationen. Als digitaler Nomade reist er zwischen den Vereinigten Arabischen Emiraten, der Türkei, Russland und der GUS. Damir hat einen Bachelor-Abschluss in Physik, der ihm seiner Meinung nach die Fähigkeiten zum kritischen Denken vermittelt hat, die er braucht, um in der sich ständig verändernden Landschaft des Internets erfolgreich zu sein. 

Angesichts der Volatilität wächst der institutionelle Appetit auf Bitcoin-ETFs

Offenlegungen in 13F-Anmeldungen zeigen, dass namhafte institutionelle Anleger sich mit Bitcoin-ETFs beschäftigen, was die wachsende Akzeptanz von ... unterstreicht.

Weitere Informationen

Der Tag der Verurteilung steht vor der Tür: Das Schicksal von CZ bleibt ungewiss, während das US-Gericht den Plädoyer des DOJ prüft

Changpeng Zhao steht heute vor einer Verurteilung vor einem US-Gericht in Seattle.

Weitere Informationen
Treten Sie unserer innovativen Tech-Community bei
Weiterlesen
Lesen Sie weiter
Injective schließt sich mit AltLayer zusammen, um inEVM erneut Sicherheit zu bieten
Geschäft Nachrichtenbericht Technologie
Injective schließt sich mit AltLayer zusammen, um inEVM erneut Sicherheit zu bieten
3. Mai 2024
Masa arbeitet mit Teller zusammen, um den MASA-Kreditpool einzuführen, der die USDC-Kreditaufnahme auf Basis ermöglicht
Märkte Nachrichtenbericht Technologie
Masa arbeitet mit Teller zusammen, um den MASA-Kreditpool einzuführen, der die USDC-Kreditaufnahme auf Basis ermöglicht
3. Mai 2024
Velodrome bringt in den kommenden Wochen die Beta-Version von Superchain auf den Markt und weitet sich auf OP-Stack-Layer-2-Blockchains aus
Märkte Nachrichtenbericht Technologie
Velodrome bringt in den kommenden Wochen die Beta-Version von Superchain auf den Markt und weitet sich auf OP-Stack-Layer-2-Blockchains aus
3. Mai 2024
CARV gibt Partnerschaft mit Aethir bekannt, um seine Datenschicht zu dezentralisieren und Belohnungen zu verteilen
Geschäft Nachrichtenbericht Technologie
CARV gibt Partnerschaft mit Aethir bekannt, um seine Datenschicht zu dezentralisieren und Belohnungen zu verteilen
3. Mai 2024