구글, 제미니 3.1 플래시 TTS 공개: 초현실적이고 완벽하게 제어 가능한 AI 음성 생성의 새로운 시대 열다
요컨대
구글은 AI 기반 음성 애플리케이션을 위한 향상된 제어, 표현력 및 다국어 지원을 제공하는 고급 텍스트 음성 변환 모델인 Gemini 3.1 Flash TTS를 출시했습니다.

기술 회사 구글 AI 기반 오디오 애플리케이션을 구축하는 개발자, 기업 및 최종 사용자를 위해 제어성, 표현력 및 출력 품질을 향상하도록 설계된 차세대 음성 합성 모델인 Gemini 3.1 Flash Text-to-Speech(TTS)를 출시했다고 발표했습니다.
Gemini 3.1 Flash TTS의 배포가 현재 여러 Google 플랫폼에서 진행 중입니다. 개발자는 Gemini API와 Google AI Studio를 통해 미리 보기 버전을 이용할 수 있으며, 기업 사용자는 Vertex AI를 통해 미리 보기 버전을 이용할 수 있습니다. 또한 Google Videos를 통해 Google Workspace 사용자에게도 통합 기능이 도입되어 일반 사용자 및 전문가 환경 모두에서 Gemini 3.1 Flash TTS를 사용할 수 있게 되었습니다.
업데이트된 시스템은 합성 음성 생성 기술의 발전을 보여주며, 구글은 자연스러움과 표현력 면에서 눈에 띄는 개선을 이루었다고 밝혔습니다. 음성 모델에 대한 대규모 인간 선호도 데이터를 평가하는 독립적인 벤치마킹 기관인 Artificial Analysis에 따르면, Gemini 3.1 Flash TTS는 Elo 점수 1,211점을 획득했습니다. 이 평가에서 Gemini 3.1 Flash TTS는 뛰어난 음질과 비교적 효율적인 비용 특성을 결합한 고성능 범주에 속하는 것으로 나타났습니다. 또한, 이 시스템은 70개 이상의 언어를 지원하며, 다중 화자 대화 기능과 자연어 입력 기반의 세밀한 제어 옵션을 제공합니다.
음성 생성에 대한 확장된 제어 기능과 창의적인 방향 제시
이번 릴리스의 핵심 기능은 오디오 태그의 도입입니다. 이 메커니즘을 통해 사용자는 구조화된 지침을 텍스트 프롬프트에 직접 삽입하여 음성 출력을 더욱 정밀하게 제어할 수 있습니다. 이러한 제어 기능을 통해 단일 생성 워크플로 내에서 속도, 톤 및 음성 스타일을 조정할 수 있습니다. 또한 이 시스템은 계층형 지시를 지원하여 개발자가 defi장면 컨텍스트를 지정하고, 구성 가능한 오디오 프로필을 통해 화자 역할을 할당하고, 전체 수준과 문장 수준 모두에서 전달 속성을 수정할 수 있습니다.
Vertex AI를 사용하는 엔터프라이즈 환경에서 이러한 제어 기능은 일관된 캐릭터 음성이나 동적 대화 시스템이 필요한 애플리케이션을 위한 확장 가능한 음성 생성과 같은 고급 프로덕션 사용 사례를 지원하도록 설계되었습니다. 또한 이 통합에는 내보내기 기능이 포함되어 있어 생성된 구성을 다양한 플랫폼 및 서비스에 배포할 수 있도록 API에서 바로 사용할 수 있는 형식으로 변환할 수 있습니다.
이 모델은 70개 이상의 언어에서 일관된 성능을 보여주며, 전 세계적인 규모로 배포하기에 적합한 것으로 평가받고 있습니다. 이러한 다국어 지원 기능은 향상된 운율 제어 기능과 결합되어 다양한 언어 환경에서 더욱 현지화되고 자연스러운 음성 출력을 가능하게 합니다.
개발자와 기업 사용자의 초기 테스트 피드백에 따르면 음성 디자인의 정확도가 향상되고 표현력 있는 출력물을 구성하는 데 있어 유연성이 높아진 것으로 나타났습니다. 특히 캐릭터 중심 또는 내러티브 기반 오디오 생성이 필요한 시나리오에서 더욱 복잡한 음성 상호 작용을 구축하는 데 오디오 태그 사용이 중요한 기능으로 강조되었습니다.
Gemini 3.1 Flash TTS를 통해 생성된 모든 오디오 출력에는 SynthID 워터마킹 기술이 내장되어 있습니다. 이 시스템은 생성된 오디오 콘텐츠 내에 식별 불가능한 식별자를 삽입하여 AI 생성 미디어를 감지하고 콘텐츠의 진위성을 향상시키며 오용 위험을 완화하는 데 도움을 줍니다.
책임 한계
줄 안 트러스트 프로젝트 지침, 이 페이지에 제공된 정보는 법률, 세금, 투자, 재정 또는 기타 형태의 조언을 제공하기 위한 것이 아니며 해석되어서도 안 됩니다. 손실을 감수할 수 있는 만큼만 투자하고 의심스러운 경우 독립적인 재정 조언을 구하는 것이 중요합니다. 자세한 내용은 이용약관은 물론 발행자나 광고주가 제공하는 도움말 및 지원 페이지를 참조하시기 바랍니다. MetaversePost 는 정확하고 편견 없는 보고를 위해 최선을 다하고 있지만 시장 상황은 예고 없이 변경될 수 있습니다.
저자에 관하여
전담 저널리스트인 알리사(Alisa) MPost암호화폐, 인공지능, 투자 및 광범위한 분야를 전문으로 합니다. Web3. 새로운 트렌드와 기술에 대한 예리한 안목을 바탕으로 그녀는 끊임없이 진화하는 디지털 금융 환경에 대해 독자들에게 정보를 제공하고 참여시키기 위해 포괄적인 취재를 제공합니다.
더 많은 기사
전담 저널리스트인 알리사(Alisa) MPost암호화폐, 인공지능, 투자 및 광범위한 분야를 전문으로 합니다. Web3. 새로운 트렌드와 기술에 대한 예리한 안목을 바탕으로 그녀는 끊임없이 진화하는 디지털 금융 환경에 대해 독자들에게 정보를 제공하고 참여시키기 위해 포괄적인 취재를 제공합니다.



