Novinová správa Technológia
Apríla 16, 2026

Google predstavuje Gemini 3.1 Flash TTS: Nová éra hyperrealistického, plne ovládateľného generovania reči pomocou umelej inteligencie

Stručne

Spoločnosť Google vydáva Gemini 3.1 Flash TTS, pokročilý model prevodu textu na reč s vylepšeným ovládaním, expresívnymi schopnosťami a viacjazyčnou podporou pre hlasové aplikácie riadené umelou inteligenciou.

Google predstavuje Gemini 3.1 Flash TTS: Nová éra hyperrealistického, plne ovládateľného generovania reči pomocou umelej inteligencie

Technologická spoločnosť Google oznámila vydanie Gemini 3.1 Flash Text-to-Speech (TTS), modelu syntézy reči novej generácie, ktorý je navrhnutý na zlepšenie ovládateľnosti, expresivity a kvality výstupu pre vývojárov, podniky a koncových používateľov, ktorí vytvárajú zvukové aplikácie riadené umelou inteligenciou.

Zavádzanie Gemini 3.1 Flash TTS momentálne prebieha na viacerých platformách Google. Model je k dispozícii v ukážkovej verzii pre vývojárov prostredníctvom rozhrania Gemini API a služby Google AI Studio, zatiaľ čo podnikoví používatelia k nemu majú prístup v ukážkovej verzii prostredníctvom služby Vertex AI. Zavádza sa aj integrácia pre používateľov služby Google Workspace prostredníctvom služby Google Vids, čím sa rozširuje dostupnosť modelu v spotrebiteľskom aj profesionálnom prostredí.

Aktualizovaný systém predstavuje pokrok v generovaní syntetického hlasu, pričom Google hlási merateľné zlepšenia v prirodzenosti a expresívnych schopnostiach. Podľa nezávislého benchmarkingu spoločnosti Artificial Analysis, ktorá vyhodnocuje rozsiahle údaje o ľudských preferenciách pre rečové modely, dosiahol Gemini 3.1 Flash TTS skóre Elo 1 211. Rovnaké hodnotenie zaraďuje model do kategórie vysokého výkonu, ktorá kombinuje silnú kvalitu reči s relatívne efektívnymi nákladovými charakteristikami. Systém tiež podporuje viac ako 70 jazykov a zahŕňa funkciu dialógu s viacerými rečníkmi, spolu s možnosťami jemného ovládania riadenými vstupmi z prirodzeného jazyka.

Rozšírené ovládacie prvky a kreatívne smerovanie pre generovanie reči

Kľúčovou funkciou tejto verzie je zavedenie zvukových značiek, mechanizmu, ktorý umožňuje používateľom presnejšie riadiť hlasový výstup vložením štruktúrovaných pokynov priamo do textových výziev. Tieto ovládacie prvky umožňujú úpravy tempa, tónu a hlasového štýlu v rámci pracovného postupu jednej generácie. Systém tiež podporuje vrstvené riadenie, čo umožňuje vývojárom defikontext scény, priraďte role rečníkov prostredníctvom konfigurovateľných zvukových profilov a upravte atribúty doručenia na globálnej aj vetnej úrovni.

V podnikových prostrediach využívajúcich Vertex AI sú tieto ovládacie prvky určené na podporu pokročilejších produkčných prípadov použitia vrátane škálovateľného generovania hlasu pre aplikácie vyžadujúce konzistentné hlasy postáv alebo dynamické dialógové systémy. Integrácia zahŕňa aj funkciu exportu, ktorá umožňuje previesť vygenerované konfigurácie do formátov pripravených pre API pre nasadenie na rôznych platformách a službách.

Model bol navrhnutý tak, aby bol vhodný na globálne nasadenie s konzistentným výkonom vo viac ako 70 jazykoch. Táto viacjazyčná schopnosť je kombinovaná s vylepšenou kontrolou prozódie, čo umožňuje lokalizovanejšie a prirodzenejšie znejúce rečové výstupy v rôznych jazykových kontextoch.

Spätná väzba z prvého testovania od vývojárov a podnikových používateľov naznačila zvýšenú presnosť v hlasovom dizajne a väčšiu flexibilitu pri formovaní expresívneho výstupu. Použitie zvukových značiek bolo zdôraznené ako významný doplnok pri vytváraní zložitejších hovorených interakcií, najmä v scenároch vyžadujúcich generovanie zvuku riadeného postavami alebo naratívom.

Všetok zvukový výstup generovaný prostredníctvom Gemini 3.1 Flash TTS je vybavený technológiou vodoznaku SynthID. Tento systém zavádza do generovaného zvukového obsahu nepostrehnuteľný identifikátor, ktorý umožňuje detekciu médií generovaných umelou inteligenciou a podporuje úsilie o zlepšenie autenticity obsahu a zmiernenie rizík zneužitia.

Tagy:

Disclaimer

V súlade s Pokyny k projektu Trust, uvedomte si, že informácie uvedené na tejto stránke nie sú zamýšľané a nemali by byť interpretované ako právne, daňové, investičné, finančné alebo iné formy poradenstva. Je dôležité investovať len toľko, koľko si môžete dovoliť stratiť a v prípade akýchkoľvek pochybností vyhľadať nezávislé finančné poradenstvo. Ak chcete získať ďalšie informácie, odporúčame vám pozrieť si zmluvné podmienky, ako aj stránky pomoci a podpory poskytnuté vydavateľom alebo inzerentom. MetaversePost sa zaviazala poskytovať presné a nezaujaté správy, ale podmienky na trhu sa môžu zmeniť bez upozornenia.

O autorovi

Alisa, oddaná novinárka v MPost, špecializuje sa na kryptomeny, umelú inteligenciu, investície a rozsiahlu oblasť Web3. So záujmom o nové trendy a technológie poskytuje komplexné pokrytie s cieľom informovať a zapojiť čitateľov do neustále sa vyvíjajúceho prostredia digitálnych financií.

Ďalšie články
Alisa Davidsonová
Alisa Davidsonová

Alisa, oddaná novinárka v MPost, špecializuje sa na kryptomeny, umelú inteligenciu, investície a rozsiahlu oblasť Web3. So záujmom o nové trendy a technológie poskytuje komplexné pokrytie s cieľom informovať a zapojiť čitateľov do neustále sa vyvíjajúceho prostredia digitálnych financií.

Hot Stories
Pridajte sa k nášmu newsletteru.
Novinky

Pokoj pred búrkou Solana: Čo teraz hovoria grafy, veľryby a signály na reťazci

Spoločnosť Solana preukázala silný výkon, ktorý bol poháňaný rastúcim prijatím, inštitucionálnym záujmom a kľúčovými partnerstvami, pričom zároveň čelí potenciálnym...

vedieť viac

Kryptomeny v apríli 2025: Kľúčové trendy, zmeny a čo bude ďalej

V apríli 2025 sa kryptopriestor zameral na posilnenie základnej infraštruktúry, pričom Ethereum sa pripravovalo na Pectru ...

vedieť viac
Čítaj viac
Čítaj viac
10 projektov transformujúcich nástroje Wall Street na DeFi v 2026
Novinová správa Technológia
10 projektov transformujúcich nástroje Wall Street na DeFi v 2026
Môže 14, 2026
Zmrazených 450 miliónov dolárov a ich počet pribúda: Jednotka pre finančnú kriminalitu T3 podporovaná Tetherom rozširuje globálne zásahy proti nelegálnym krypto tokom
Novinová správa
Zmrazených 450 miliónov dolárov a ich počet pribúda: Jednotka pre finančnú kriminalitu T3 podporovaná Tetherom rozširuje globálne zásahy proti nelegálnym krypto tokom
Môže 14, 2026
Reťazec BNB sa zameriava na kybernetické hrozby zajtrajška pomocou kvantovo odolnej aktualizácie
Novinová správa Technológia
Reťazec BNB sa zameriava na kybernetické hrozby zajtrajška pomocou kvantovo odolnej aktualizácie
Môže 14, 2026
AutoScientist od spoločnosti Adaption automatizuje jemné doladenie modelu pomocou tréningu v uzavretej slučke, čím prekonáva konfigurácie navrhnuté človekom. 
Novinová správa Technológia
AutoScientist od spoločnosti Adaption automatizuje jemné doladenie modelu pomocou tréningu v uzavretej slučke, čím prekonáva konfigurácie navrhnuté človekom. 
Môže 14, 2026
CRYPTOMERIA LABS PTE. LTD.