Nieuwsverslag Technologie
07 november 2023

Fluister V3 door OpenAI Gaat open source en breidt stemherkenning uit in verschillende talen

In het kort

OpenAI heeft de open-source release aangekondigd van WHISPER V3, een geavanceerd model voor stemherkenning in meerdere talen.

OpenAI Onthult Whisper V3: een revolutie in stemherkenning in verschillende talen

Onderzoeksbureau voor kunstmatige intelligentie (AI). OpenAI, heeft een aanzienlijke sprong voorwaarts gemaakt op het gebied van spraakherkenning door zijn ultramoderne model open te sourcen Whisper groot-v3, tijdens hun Developer Day-evenement.

Deze nieuwste versie van het Whisper-model demonstreert een opmerkelijk vermogen om stem in een groot aantal talen te begrijpen en te transcriberen, waardoor de toepasbaarheid ervan wordt uitgebreid tot buiten de op het Engels gerichte modellen uit het verleden.

Whisper large-v3 gedijt onder uiteenlopende omstandigheden en kan vakkundig omgaan met verschillende taalinvoer. Think OpenAI, terwijl modellen gericht zijn op Engelse applicaties zoals tiny.en en base.en superieure prestaties laten zien. De effectiviteit van Whisper large-v3 is echter onderhevig aan schommelingen, afhankelijk van de taal die wordt getranscribeerd.

Oorspronkelijk concentreerde het model zich bij de lancering afgelopen september op Engels, maar in december breidde het zijn mogelijkheden uit met versie 2 met ondersteuning voor een reeks talen, hoewel er niet werd gespecificeerd welke talen.

Whisper large-v3 beschikbaar onder een permissieve licentie op GitHub, stelt gebruikers in staat verschillende vormen van inhoud te transcriberen met de beste nauwkeurigheid in zijn klasse. De unieke tijdstempelfunctie voegt aanzienlijke waarde toe en kan een revolutie teweegbrengen in het genereren van ondertitels op videoplatforms zoals YouTube.

Bron: OpenAI

OpenAI's Doorbraak in meertalige spraakherkenning

Whisper large-v3 verwerkt audio door het eerst te segmenteren in clips van 30 seconden en het vervolgens door een complex systeem te laten lopen dat een encoder en decoder bevat om de uitvoer te genereren.

Deze componenten werken samen om de tekstuele transcriptie van de gesproken woorden te voorspellen. Een van de technische hoogtepunten van Whisper large-v3 is de taalidentificatiefunctie, die niet alleen meertalige spraak transcribeert, maar deze ook naar het Engels vertaalt.

Terwijl de oorspronkelijke plannen integratie met het populaire suggereerden ChatGPT om directe steminteractie met de chatbot mogelijk te maken, OpenAI heeft ervoor gekozen om het publiek directe toegang te verlenen tot Whisper large-v3. Het is vermeldenswaard dat de huidige doelgroep voor Whisper voornamelijk uit onderzoekers bestaat, en niet uit het grote publiek.

OpenAI's toewijding aan het bevorderen van robuuste spraakverwerking blijkt duidelijk uit hun beslissing om Whisper large-v3 te openen. De organisatie onderstreept haar doelstelling om de ontwikkeling van praktische toepassingen en verder onderzoek op dit gebied te bevorderen.

OpenAI heeft zijn AI-tool verfijnd met een enorme dataset met 680,000 uur aan nauwkeurig gecontroleerde gegevens verzameld via internet, inclusief een aanzienlijk deel van niet-Engelse audio. Deze stap is bedoeld om innovatie te stimuleren en de reikwijdte van spraakherkenningstechnologie wereldwijd te verbreden.

Disclaimer

In lijn met de Richtlijnen voor vertrouwensprojectenHoud er rekening mee dat de informatie op deze pagina niet bedoeld is en niet mag worden geïnterpreteerd als juridisch, fiscaal, beleggings-, financieel of enige andere vorm van advies. Het is belangrijk om alleen te beleggen wat u zich kunt veroorloven te verliezen en onafhankelijk financieel advies in te winnen als u twijfels heeft. Voor meer informatie raden wij u aan de algemene voorwaarden en de hulp- en ondersteuningspagina's van de uitgever of adverteerder te raadplegen. MetaversePost streeft naar nauwkeurige, onpartijdige berichtgeving, maar de marktomstandigheden kunnen zonder voorafgaande kennisgeving worden gewijzigd.

Over de auteur

Nik is een ervaren analist en schrijver bij Metaverse Post, gespecialiseerd in het leveren van geavanceerde inzichten in de snelle wereld van technologie, met een bijzondere nadruk op AI/ML, XR, VR, on-chain analytics en blockchain-ontwikkeling. Zijn artikelen betrekken en informeren een divers publiek, waardoor ze de technologische curve voor blijven. Nik heeft een masterdiploma in economie en management en heeft een goed begrip van de nuances van de zakenwereld en de kruising met opkomende technologieën.

Meer artikelen
Nik Asti
Nik Asti

Nik is een ervaren analist en schrijver bij Metaverse Post, gespecialiseerd in het leveren van geavanceerde inzichten in de snelle wereld van technologie, met een bijzondere nadruk op AI/ML, XR, VR, on-chain analytics en blockchain-ontwikkeling. Zijn artikelen betrekken en informeren een divers publiek, waardoor ze de technologische curve voor blijven. Nik heeft een masterdiploma in economie en management en heeft een goed begrip van de nuances van de zakenwereld en de kruising met opkomende technologieën.

Van Ripple tot The Big Green DAO: hoe cryptocurrency-projecten bijdragen aan liefdadigheid

Laten we initiatieven onderzoeken die het potentieel van digitale valuta voor goede doelen benutten.

Meer weten

AlphaFold 3, Med-Gemini en anderen: de manier waarop AI de gezondheidszorg transformeert in 2024

AI manifesteert zich op verschillende manieren in de gezondheidszorg, van het blootleggen van nieuwe genetische correlaties tot het versterken van robotchirurgische systemen...

Meer weten
Sluit u aan bij onze innovatieve technologiegemeenschap
Lees meer
Lees meer
The Great Crypto Leap: hoe Ethereum ETF's een rotsachtige weg banen voor Solana en daarbuiten
Advies Zakelijk Markten Software Technologie
The Great Crypto Leap: hoe Ethereum ETF's een rotsachtige weg banen voor Solana en daarbuiten
22 juli 2024
zkLink kondigt lancering aan van ZKL op grote crypto-uitwisselingen, opent claimvenster voor Novadrop
Markten Nieuwsverslag Technologie
zkLink kondigt lancering aan van ZKL op grote crypto-uitwisselingen, opent claimvenster voor Novadrop
22 juli 2024
Bitfinex Alpha-analyse benadrukt bullish signalen die het opwaartse momentum van Bitcoin ondersteunen
Markten Nieuwsverslag Technologie
Bitfinex Alpha-analyse benadrukt bullish signalen die het opwaartse momentum van Bitcoin ondersteunen
22 juli 2024
Wall Street ontmoet Blockchain: de tokenized aandelen van Backed veranderen door te investeren in technologiegiganten Microsoft, Tesla en GameStop
Advies Zakelijk Markten Software Technologie
Wall Street ontmoet Blockchain: de tokenized aandelen van Backed veranderen door te investeren in technologiegiganten Microsoft, Tesla en GameStop
22 juli 2024