Buletin de stiri Tehnologia
08 Mai, 2026

Nou OpenAI Modelele audio alimentează asistenții vocali în timp real cu traducere multilingvă și inteligență de streaming

Pe scurt

OpenAI eliberat GPT-Modele Realtime-2, Translate și Whisper, extinzând inteligența artificială vocală în timp real cu raționament, traducere și transcriere pentru aplicații conversaționale avansate.

Nou OpenAI Modelele audio alimentează asistenții vocali în timp real cu traducere multilingvă și inteligență de streaming

OpenAI a anunțat un nou set de modele audio în cadrul ecosistemului său API, marcând o extindere a capacităților vocale în timp real pentru dezvoltatori și aplicații bazate pe inteligență artificială. Lansarea include GPT-Realtime-2, GPT-Realtime-Traduce și GPT-Realtime-Whisper, fiecare conceput pentru a permite interacțiuni vocale mai avansate, receptive și contextuale într-o gamă largă de cazuri de utilizare.

GPTRealtime-2 este poziționat ca cel mai avansat model vocal al companiei de până acum, introducând GPT-5raționamentul de clasă în conversații audio live. Modelul este conceput pentru a gestiona solicitări complexe ale utilizatorilor, a menține continuitatea contextuală și a susține raționamentul în mai mulți pași în timp ce interacționează în timp real. Este destinat aplicațiilor în care agenții vocali nu numai că trebuie să răspundă rapid, ci și să interpreteze intenția, să gestioneze întreruperile și să execute sarcini prin utilizarea integrată a instrumentelor.

Alături de ea, GPT-Realtime-Translate permite traducerea vorbirii în timp real în peste 70 de limbi de intrare în 13 limbi de ieșire. Sistemul este conceput pentru a menține fluxul conversațional, păstrând în același timp sensul și ritmul, permițând vorbitorilor să comunice în diferite limbi fără întârzieri vizibile. Această capacitate este destinată asistenței globale pentru clienți, educației, călătoriilor și serviciilor de comunicare transfrontaliere.

Al treilea model, GPT-Realtime-Whisper, se concentrează pe transmiterea în flux a transcrierii vorbirii în text. Acesta oferă transcriere continuă, cu latență redusă, pe măsură ce utilizatorii vorbesc, permițând subtitrări în timp real, documentație live și procesare imediată în aval a conținutului vorbit. Modelul este conceput pentru medii în care este necesară conversia rapidă a vorbirii în text, cum ar fi întâlniri, transmisiuni media și fluxuri de lucru în cadrul întreprinderilor.

OpenAI a descris lansarea combinată ca un pas către interfețe vocale care depășesc sistemele de comandă și răspuns de bază. În loc să recunoască pur și simplu vorbirea și să genereze răspunsuri, modelele sunt destinate să sprijine raționamentul continuu, traducerea, transcrierea și executarea acțiunilor într-un singur flux conversațional. Scopul este de a permite sisteme bazate pe voce care pot funcționa mai mult ca asistenți interactivi capabili să finalizeze sarcini, menținând în același timp dialogul natural.

GPT-Realtime-2 avansează arhitectura inteligenței artificiale vocale cu sisteme vocale de acțiune și ferestre contextuale extinse

Compania a evidențiat câteva modele de design emergente, facilitate de această tehnologie. Acestea includ sistemele de traducere vocală, în care utilizatorii pot descrie sarcini executate prin raționament automat și integrare de instrumente; aplicațiile de traducere vocală, în care software-ul generează îndrumări vocale pe baza datelor contextuale; și sistemele de traducere vocală, care permit comunicarea multilingvă în timp real între vorbitori.

GPT-Realtime-2 introduce îmbunătățiri arhitecturale suplimentare pentru utilizarea în producție. Acestea includ ferestre de context mai lungi, extinse la 128K de jetoane, un comportament îmbunătățit de recuperare în timpul întreruperilor sau erorilor, execuție paralelă a instrumentelor cu feedback transparent și o ajustare a tonului mai controlabilă în funcție de contextul conversațional. Dezvoltatorii pot, de asemenea, să ajusteze fin nivelurile de raționament pentru a echilibra viteza și complexitatea în funcție de nevoile aplicației.

Criterii de performanță citate de OpenAI indică rezultate îmbunătățite în raționamentul bazat pe audio și în sarcinile de urmărire a instrucțiunilor în comparație cu iterațiile anterioare ale modelelor sale în timp real. Sistemul demonstrează, de asemenea, o gestionare mai puternică a terminologiei specifice domeniului și un comportament mai stabil în contexte conversaționale cu mai multe rânduri de răspuns.

Lansarea include, de asemenea, mecanisme de siguranță, inclusiv monitorizare în timp real și clasificare a conținutului în cadrul sesiunilor active, alături de controale la nivel de dezvoltator pentru măsuri de siguranță suplimentare. Modelele sunt disponibile prin intermediul API-ului Realtime și sunt poziționate pentru implementare în aplicații enterprise, de consum și pentru dezvoltatori, cu prețuri structurate pe baza unor metrici de procesare audio bazate pe utilizare.

Introducerea GPT-Realtime-2 și modelele sale însoțitoare reflectă o trecere mai amplă către sisteme de calcul bazate pe voce, capabile să raționeze, să traducă și să transcrie în timp real, cu scopul de a face interacțiunea vorbită cu software-ul mai funcțională, adaptivă și operațională.

Declinare a responsabilităţii

În conformitate cu Ghidurile proiectului Trust, vă rugăm să rețineți că informațiile furnizate pe această pagină nu sunt destinate și nu trebuie interpretate ca fiind consiliere juridică, fiscală, investițională, financiară sau orice altă formă de consiliere. Este important să investești doar ceea ce îți poți permite să pierzi și să cauți sfaturi financiare independente dacă ai îndoieli. Pentru informații suplimentare, vă sugerăm să consultați termenii și condițiile, precum și paginile de ajutor și asistență furnizate de emitent sau agent de publicitate. MetaversePost se angajează să raporteze corecte, imparțial, dar condițiile de piață pot fi modificate fără notificare.

Despre autor

Alisa, o jurnalistă dedicată la MPost, specializată în criptomonede, inteligență artificială, investiții și domeniul vast al Web3. Cu un ochi aprofundat pentru tendințele și tehnologiile emergente, ea oferă o acoperire cuprinzătoare pentru a informa și a implica cititorii în peisajul în continuă evoluție al finanțelor digitale.

Mai multe articole
Alisa Davidson
Alisa Davidson

Alisa, o jurnalistă dedicată la MPost, specializată în criptomonede, inteligență artificială, investiții și domeniul vast al Web3. Cu un ochi aprofundat pentru tendințele și tehnologiile emergente, ea oferă o acoperire cuprinzătoare pentru a informa și a implica cititorii în peisajul în continuă evoluție al finanțelor digitale.

Hot Stories
Alăturați-vă Newsletter-ului nostru.
Ultimele ştiri

Cum construiește Minmax terminalul profesional de tranzacționare cu inteligență artificială - Predicții - Piețele încă nu au succes în 2026

Minmax a procesat un volum de aproximativ 100,000 de dolari în primele trei zile ale lunii iunie, majoritatea prin ...

Aflați mai multe

Calmul dinaintea furtunii Solana: Ce spun acum graficele, balenele și semnalele on-chain

Solana a demonstrat o performanță solidă, determinată de creșterea adopției, a interesului instituțional și a parteneriatelor cheie, confruntându-se în același timp cu potențiale...

Aflați mai multe
Citește mai mult
Află mai multe
Dezbaterea fundamentală despre Bitcoin: Galaxy, NYDIG și Standard Chartered diverg, dar Bitwise spune că adevărata întrebare este creșterea
pieţe Buletin de stiri Tehnologia
Dezbaterea fundamentală despre Bitcoin: Galaxy, NYDIG și Standard Chartered diverg, dar Bitwise spune că adevărata întrebare este creșterea
16 Iunie, 2026
Deținătorii pe termen lung de Bitcoin ating o cotă record a ofertei, în timp ce piețele așteaptă prima decizie a lui Warsh din partea FOMC
pieţe Buletin de stiri Tehnologia
Deținătorii pe termen lung de Bitcoin ating o cotă record a ofertei, în timp ce piețele așteaptă prima decizie a lui Warsh din partea FOMC
16 Iunie, 2026
Inveniam va achiziționa MANTRA într-o acțiune de extindere a infrastructurii de inteligență artificială, RWA și blockchain instituțional
Buletin de stiri Tehnologia
Inveniam va achiziționa MANTRA într-o acțiune de extindere a infrastructurii de inteligență artificială, RWA și blockchain instituțional
16 Iunie, 2026
Inco Lightning lansează On Base, extinzând confidențialitatea contractelor inteligente cu ajutorul calculelor criptate și a protecției datelor
Buletin de stiri Tehnologia
Inco Lightning lansează On Base, extinzând confidențialitatea contractelor inteligente cu ajutorul calculelor criptate și a protecției datelor
16 Iunie, 2026
CRYPTOMERIA LABS PTE. LTD.