Vijesti Tehnologija
Travnja 16, 2026

Google predstavlja Gemini 3.1 Flash TTS: Novo doba hiperrealističnog, potpuno kontroliranog generiranja govora pomoću umjetne inteligencije

Ukratko

Google objavljuje Gemini 3.1 Flash TTS, napredni model pretvaranja teksta u govor s poboljšanom kontrolom, ekspresivnošću i višejezičnom podrškom za glasovne aplikacije pokretane umjetnom inteligencijom.

Google predstavlja Gemini 3.1 Flash TTS: Novo doba hiperrealističnog, potpuno kontroliranog generiranja govora pomoću umjetne inteligencije

Tehnološka tvrtka Google najavio je izlazak Gemini 3.1 Flash Text-to-Speech (TTS), modela sinteze govora nove generacije osmišljenog za poboljšanje upravljivosti, ekspresivnosti i kvalitete izlaza za razvojne programere, poduzeća i krajnje korisnike koji izrađuju audio aplikacije pokretane umjetnom inteligencijom.

Uvođenje Gemini 3.1 Flash TTS-a trenutno je u tijeku na više Googleovih platformi. Model je dostupan u probnoj verziji za razvojne programere putem Gemini API-ja i Google AI Studija, dok mu poslovni korisnici mogu pristupiti u probnoj verziji putem Vertex AI-ja. Integracija se također uvodi za korisnike Google Workspacea putem Google Vidsa, proširujući dostupnost modela u potrošačkim i profesionalnim okruženjima.

Ažurirani sustav predstavlja napredak u generiranju sintetičkog glasa, a Google izvještava o mjerljivim poboljšanjima u prirodnosti i ekspresivnim sposobnostima. Prema neovisnom benchmarkingu tvrtke Artificial Analysis, koja procjenjuje velike količine podataka o ljudskim preferencijama za govorne modele, Gemini 3.1 Flash TTS postigao je Elo rezultat od 1,211. Ista evaluacija smješta model u kategoriju visokih performansi koja kombinira snažnu kvalitetu govora s relativno učinkovitim cjenovnim karakteristikama. Sustav također podržava više od 70 jezika i uključuje funkcionalnost dijaloga s više govornika, uz opcije precizne kontrole pokretane unosima prirodnog jezika.

Proširene kontrole i kreativni smjer za generiranje govora

Ključna značajka izdanja je uvođenje audio oznaka, mehanizma koji korisnicima omogućuje preciznije vođenje govornog izlaza ugradnjom strukturiranih uputa izravno u tekstualne upute. Ove kontrole omogućuju prilagodbu tempa, tona i vokalnog stila unutar jednog generiranog tijeka rada. Sustav također podržava slojevito usmjeravanje, omogućujući programerima da defikontekst scene, dodijelite uloge govornika putem konfiguriranih audio profila i mijenjajte atribute isporuke na globalnoj i rečeničnoj razini.

Unutar poslovnih okruženja koja koriste Vertex AI, ove kontrole namijenjene su podršci naprednijim produkcijskim slučajevima upotrebe, uključujući skalabilno generiranje glasa za aplikacije koje zahtijevaju konzistentne glasove likova ili dinamičke dijaloške sustave. Integracija također uključuje funkcionalnost izvoza, što omogućuje pretvaranje generiranih konfiguracija u formate spremne za API za implementaciju na različitim platformama i uslugama.

Model je pozicioniran kao prikladan za primjenu na globalnoj razini, s dosljednim performansama na više od 70 jezika. Ova višejezična sposobnost kombinirana je s poboljšanom kontrolom prozodije, omogućujući lokaliziranije i prirodnije govorne izlaze u različitim jezičnim kontekstima.

Rane povratne informacije o testiranju od programera i poslovnih korisnika ukazale su na povećanu preciznost u dizajnu glasa i veću fleksibilnost u oblikovanju ekspresivnog izlaza. Korištenje audio oznaka istaknuto je kao značajan dodatak za konstruiranje složenijih govornih interakcija, posebno u scenarijima koji zahtijevaju generiranje zvuka vođenog likovima ili narativnog zvuka.

Sav audio izlaz generiran putem Gemini 3.1 Flash TTS-a ugrađen je u SynthID tehnologiju vodenog žiga. Ovaj sustav uvodi neprimjetni identifikator unutar generiranog audio sadržaja, omogućujući otkrivanje medija generiranih umjetnom inteligencijom i podržavajući napore za poboljšanje autentičnosti sadržaja i ublažavanje rizika od zlouporabe.

Oznake:

Izjava o odricanju od odgovornosti

U skladu s Smjernice projekta povjerenja, imajte na umu da informacije navedene na ovoj stranici nemaju namjeru i ne smiju se tumačiti kao pravni, porezni, investicijski, financijski ili bilo koji drugi oblik savjeta. Važno je ulagati samo ono što si možete priuštiti izgubiti i potražiti neovisni financijski savjet ako imate bilo kakvih nedoumica. Za dodatne informacije predlažemo da pogledate odredbe i uvjete, kao i stranice za pomoć i podršku koje pruža izdavatelj ili oglašivač. MetaversePost je predan točnom, nepristranom izvješćivanju, ali tržišni uvjeti podložni su promjenama bez prethodne najave.

O autoru

Alisa, predana novinarka u MPost, specijaliziran za kriptovalute, umjetnu inteligenciju, ulaganja i široko područje Web3. S oštrim okom za nove trendove i tehnologije, ona pruža sveobuhvatnu pokrivenost kako bi informirala i uključila čitatelje u krajolik digitalnih financija koji se neprestano razvija.

Više članaka
Alisa Davidson
Alisa Davidson

Alisa, predana novinarka u MPost, specijaliziran za kriptovalute, umjetnu inteligenciju, ulaganja i široko područje Web3. S oštrim okom za nove trendove i tehnologije, ona pruža sveobuhvatnu pokrivenost kako bi informirala i uključila čitatelje u krajolik digitalnih financija koji se neprestano razvija.

Hot Stories
Pridružite se našem biltenu.
Najnovije vijesti

Kako Minmax gradi profesionalni AI trgovački terminal za predviđanja. Tržišta još uvijek nedostaju u 2026.

Minmax je u prva tri dana lipnja obradio otprilike 100,000 dolara, većinom putem ...

Znati više

Zatišje prije oluje Solana: Što sada govore grafikoni, kitovi i signali na lancu

Solana je pokazala snažne rezultate, potaknute sve većim usvajanjem, institucionalnim interesom i ključnim partnerstvima, dok se istovremeno suočava s potencijalnim ...

Znati više
Pročitaj više
Pročitaj više
Kako Minmax gradi profesionalni AI trgovački terminal za predviđanja. Tržišta još uvijek nedostaju u 2026.
Analiza Vijesti Tehnologija
Kako Minmax gradi profesionalni AI trgovački terminal za predviđanja. Tržišta još uvijek nedostaju u 2026.
Lipnja 8, 2026
ZachXBT: Sukob s kripto kriminalom u Dubaiju usmjeren je na osumnjičenike povezane s prijevarom i kršenjem podataka vrijednim 19 milijuna dolara
Vijesti Tehnologija
ZachXBT: Sukob s kripto kriminalom u Dubaiju usmjeren je na osumnjičenike povezane s prijevarom i kršenjem podataka vrijednim 19 milijuna dolara
Lipnja 8, 2026
NVIDIA jača strategiju tvornice umjetne inteligencije ugovorom s SK hynixom i proširenim inicijativama za podatkovne centre u Južnoj Koreji
Vijesti Tehnologija
NVIDIA jača strategiju tvornice umjetne inteligencije ugovorom s SK hynixom i proširenim inicijativama za podatkovne centre u Južnoj Koreji
Lipnja 8, 2026
10 najboljih platformi koje donose institucionalni kredit na lanac u 2026. godini
Top liste Tehnologija
10 najboljih platformi koje donose institucionalni kredit na lanac u 2026. godini
Lipnja 8, 2026
CRYPTOMERIA LABS PTE. LTD.