Ulat sa Balita Teknolohiya
Abril 16, 2026

Inilabas ng Google ang Gemini 3.1 Flash TTS: Isang Bagong Panahon ng Hyper-Realistic, Ganap na Kontroladong Paglikha ng Pagsasalita gamit ang AI

Sa madaling sabi

Inilabas ng Google ang Gemini 3.1 Flash TTS, isang advanced na text-to-speech model na may pinahusay na kontrol, ekspresyon, at suporta sa maraming wika para sa mga aplikasyon ng boses na pinapagana ng AI.

Inilabas ng Google ang Gemini 3.1 Flash TTS: Isang Bagong Panahon ng Hyper-Realistic, Ganap na Kontroladong Paglikha ng Pagsasalita gamit ang AI

Kumpanya ng teknolohiya Google Inihayag ng kompanya ng teknolohiya ang paglabas ng Gemini 3.1 Flash Text-to-Speech (TTS), isang bagong henerasyon ng modelo ng speech synthesis na idinisenyo upang mapabuti ang kakayahang kontrolin, maipahayag, at kalidad ng output para sa mga developer, negosyo, at mga end user na bumubuo ng mga AI-driven na audio application.

Kasalukuyang isinasagawa ang paglulunsad ng Gemini 3.1 Flash TTS sa maraming platform ng Google. Ang modelo ay available bilang preview para sa mga developer sa pamamagitan ng Gemini API at Google AI Studio, habang maaaring ma-access ito ng mga enterprise user bilang preview sa pamamagitan ng Vertex AI. Ipinakikilala rin ang integrasyon para sa mga user ng Google Workspace sa pamamagitan ng Google Vids, na nagpapalawak sa availability ng modelo sa mga consumer at propesyonal na kapaligiran.

Ang na-update na sistema ay kumakatawan sa isang pagsulong sa pagbuo ng sintetikong boses, kung saan iniuulat ng Google ang masusukat na mga pagpapabuti sa pagiging natural at kakayahang magpahayag. Ayon sa independiyenteng benchmarking ng Artificial Analysis, na sumusuri sa malawakang datos ng kagustuhan ng tao para sa mga modelo ng pagsasalita, ang Gemini 3.1 Flash TTS ay nakamit ang markang Elo na 1,211. Ang parehong pagsusuri ay naglalagay sa modelo sa loob ng isang kategoryang may mataas na pagganap na pinagsasama ang malakas na kalidad ng pagsasalita na may medyo mahusay na mga katangian sa gastos. Sinusuportahan din ng sistema ang mahigit 70 wika at may kasamang functionality ng diyalogo para sa maraming nagsasalita, kasama ang mga pinong opsyon sa pagkontrol na pinapagana ng mga input ng natural na wika.

Pinalawak na mga Kontrol at Malikhaing Direksyon para sa Paglikha ng Pagsasalita

Isang mahalagang katangian ng paglabas ay ang pagpapakilala ng mga audio tag, isang mekanismo na nagbibigay-daan sa mga gumagamit na gabayan ang output ng pagsasalita nang mas tumpak sa pamamagitan ng pag-embed ng mga nakabalangkas na tagubilin nang direkta sa mga text prompt. Ang mga kontrol na ito ay nagbibigay-daan sa mga pagsasaayos sa bilis, tono, at istilo ng boses sa loob ng isang daloy ng trabaho ng henerasyon. Sinusuportahan din ng system ang layered na direksyon, na nagpapahintulot sa mga developer na defikonteksto ng eksena, magtalaga ng mga tungkulin sa tagapagsalita sa pamamagitan ng mga maaaring i-configure na audio profile, at baguhin ang mga katangian ng paghahatid sa parehong pandaigdigan at antas ng pangungusap.

Sa loob ng mga kapaligirang pang-enterprise na gumagamit ng Vertex AI, ang mga kontrol na ito ay inilaan upang suportahan ang mas advanced na mga kaso ng paggamit sa produksyon, kabilang ang scalable voice generation para sa mga application na nangangailangan ng pare-parehong mga boses ng karakter o mga dynamic na sistema ng diyalogo. Kasama rin sa integrasyon ang functionality ng pag-export, na nagpapahintulot sa mga nabuong configuration na ma-convert sa mga format na handa para sa API para sa pag-deploy sa iba't ibang platform at serbisyo.

Ang modelo ay naiposisyon bilang angkop para sa pandaigdigang pag-deploy, na may pare-parehong pagganap sa mahigit 70 wika. Ang kakayahang multilingual na ito ay sinamahan ng pinahusay na kontrol sa prosody, na nagbibigay-daan sa mas lokal at natural na tunog na mga output ng pagsasalita sa iba't ibang kontekstong lingguwistika.

Ang maagang feedback mula sa mga developer at enterprise user sa pagsubok ay nagpakita ng mas mataas na katumpakan sa disenyo ng boses at mas malawak na kakayahang umangkop sa paghubog ng nagpapahayag na output. Ang paggamit ng mga audio tag ay itinampok bilang isang mahalagang karagdagan para sa pagbuo ng mas kumplikadong mga interaksyon sa pagsasalita, lalo na sa mga senaryo na nangangailangan ng pagbuo ng audio na batay sa karakter o naratibo.

Ang lahat ng audio output na nalilikha sa pamamagitan ng Gemini 3.1 Flash TTS ay may naka-embed na teknolohiya ng SynthID watermarking. Ang sistemang ito ay nagpapakilala ng isang hindi mahahalatang identifier sa loob ng nabuong nilalaman ng audio, na nagbibigay-daan sa pag-detect ng media na nabuo ng AI at sumusuporta sa mga pagsisikap na mapabuti ang pagiging tunay ng nilalaman at mabawasan ang mga panganib ng maling paggamit.

Pagtanggi sa pananagutan

Sa linya na may Mga alituntunin ng Trust Project, pakitandaan na ang impormasyong ibinigay sa pahinang ito ay hindi nilayon at hindi dapat bigyang-kahulugan bilang legal, buwis, pamumuhunan, pananalapi, o anumang iba pang paraan ng payo. Mahalagang mamuhunan lamang kung ano ang maaari mong mawala at humingi ng independiyenteng payo sa pananalapi kung mayroon kang anumang mga pagdududa. Para sa karagdagang impormasyon, iminumungkahi naming sumangguni sa mga tuntunin at kundisyon pati na rin sa mga pahina ng tulong at suporta na ibinigay ng nagbigay o advertiser. MetaversePost ay nakatuon sa tumpak, walang pinapanigan na pag-uulat, ngunit ang mga kondisyon ng merkado ay maaaring magbago nang walang abiso.

Tungkol sa Ang May-akda

Alisa, isang dedikadong mamamahayag sa MPost, ay dalubhasa sa crypto, AI, mga pamumuhunan, at sa malawak na larangan ng Web3. Sa isang matalas na mata para sa mga umuusbong na uso at teknolohiya, naghahatid siya ng komprehensibong saklaw upang ipaalam at hikayatin ang mga mambabasa sa patuloy na umuusbong na tanawin ng digital finance.

Mas marami pang artikulo
Alisa Davidson
Alisa Davidson

Alisa, isang dedikadong mamamahayag sa MPost, ay dalubhasa sa crypto, AI, mga pamumuhunan, at sa malawak na larangan ng Web3. Sa isang matalas na mata para sa mga umuusbong na uso at teknolohiya, naghahatid siya ng komprehensibong saklaw upang ipaalam at hikayatin ang mga mambabasa sa patuloy na umuusbong na tanawin ng digital finance.

Hot Stories
Sumali sa Aming Newsletter.
Pinakabagong Balita

Paano Binubuo ng Minmax ang Propesyonal na AI Trading Terminal? Kulang Pa Rin ang Prediksyon sa mga Merkado sa 2026

Ang Minmax ay nagproseso ng humigit-kumulang $100,000 na dami sa unang tatlong araw ng Hunyo, karamihan nito ay sa pamamagitan ng ...

Malaman Higit Pa

Ang Kalmado Bago Ang Bagyo ng Solana: Ano ang Sinasabi Ngayon ng mga Chart, Whale, At On-Chain Signal

Ang Solana ay nagpakita ng malakas na pagganap, na hinihimok ng pagtaas ng pag-aampon, interes sa institusyon, at pangunahing pakikipagsosyo, habang nahaharap sa potensyal ...

Malaman Higit Pa
Magbasa Pa
Magbasa nang higit pa
Paano Binubuo ng Minmax ang Propesyonal na AI Trading Terminal? Kulang Pa Rin ang Prediksyon sa mga Merkado sa 2026
Pagsusuri Ulat sa Balita Teknolohiya
Paano Binubuo ng Minmax ang Propesyonal na AI Trading Terminal? Kulang Pa Rin ang Prediksyon sa mga Merkado sa 2026
Hunyo 8, 2026
ZachXBT: Pagsugpo sa Krimen sa Crypto sa Dubai, Tinatarget ang mga Suspek na Nakaugnay sa $19M na Pandaraya at mga Iskema ng Paglabag sa Data
Ulat sa Balita Teknolohiya
ZachXBT: Pagsugpo sa Krimen sa Crypto sa Dubai, Tinatarget ang mga Suspek na Nakaugnay sa $19M na Pandaraya at mga Iskema ng Paglabag sa Data
Hunyo 8, 2026
Pinalalakas ng NVIDIA ang Istratehiya sa Pabrika ng AI Gamit ang Kasunduan sa SK hynix at Pinalawak na mga Inisyatibo sa Data Center ng Timog Korea
Ulat sa Balita Teknolohiya
Pinalalakas ng NVIDIA ang Istratehiya sa Pabrika ng AI Gamit ang Kasunduan sa SK hynix at Pinalawak na mga Inisyatibo sa Data Center ng Timog Korea
Hunyo 8, 2026
Nangungunang 10 Plataporma na Nagdadala ng Institusyonal na Kredito sa Chain sa 2026
Nangungunang Mga Listahan Teknolohiya
Nangungunang 10 Plataporma na Nagdadala ng Institusyonal na Kredito sa Chain sa 2026
Hunyo 8, 2026
CRYPTOMERIA LABS PTE. LTD.