뉴스 보도 Technology
2023년 6월 28일

Google, 음성 생성을 위한 강력한 AI 언어 모델인 AudioPaLM 출시

요컨대

AudioPaLM은 다음과 같이 개발된 강력한 언어 모델입니다. 구글 원활한 음성 및 텍스트 처리를 위해 텍스트 기반 모델과 음성 기반 모델을 결합합니다.

준언어 정보를 보존하고 음성 번역 작업에서 기존 시스템을 능가합니다.

AudioPaLM은 악센트가 있는 언어를 번역하고 음성 대 음성 번역을 위해 음성 전송을 수행할 수 있습니다.

Google은 다음과 같은 언어 모델을 공개했습니다. 오디오팜, 텍스트 기반 및 음성 기반 언어 모델을 결합하여 음성 및 텍스트를 원활하게 처리하고 생성합니다. 의 역량을 융합하여 PaLM-2오디오LM, AudioPaLM은 음성 인식 및 음성 대 음성 번역을 포함하여 광범위한 응용 프로그램을 여는 통합 다중 모드 아키텍처를 제공합니다.

Google, 음성 생성을 위한 강력한 언어 모델인 AudioPaLM 출시
신용 : Metaverse Post (mpost.io)

AudioPaLM의 주목할만한 기능 중 하나는 AudioLM의 영향 덕분에 화자 신원 및 억양과 같은 준언어 정보를 보존하는 기능입니다. 동시에 PaLM-2와 같은 텍스트 기반 언어 모델에서 발견되는 언어 지식을 활용합니다. 텍스트 전용 대규모 언어 모델의 가중치로 AudioPaLM을 초기화함으로써 이 모델은 사전 교육에 사용되는 광범위한 텍스트 교육 데이터를 활용하여 음성 처리에 탁월합니다.

AudioPaLM의 놀라운 기능은 다양한 실험을 통해 입증되었습니다. 음성 번역 작업에서 기존 시스템을 능가하며 제로샷 수행 능력을 보여줍니다. 음성-텍스트 번역 교육 중에 만나지 못한 언어의 경우.

또한 AudioPaLM은 다음과 같은 기능을 보여줍니다. 오디오 언어 모델 짧은 음성 프롬프트를 기반으로 언어 간에 음성을 전송합니다.

구글은 AudioPaLM 기능의 예 탐색 가능. 이탈리아어와 독일어와 같이 뚜렷한 악센트가 있는 언어를 번역하는 모델의 기능은 연구자와 사용자 모두에게 흥미를 불러일으켰습니다. 또한 음성 대 음성 번역을 위한 음성 전송 수행 능력은 자동 메트릭과 인간 평가자 모두에 의해 확인된 바와 같이 기존 기준선과 차별화됩니다.

이 모델은 사람의 목소리와 감정을 보존하면서 언어를 오디오에서 다른 언어의 오디오로 번역하는 데 매우 능숙합니다. 흥미롭게도 이 모델은 이탈리아어와 독일어와 같은 일부 언어를 번역할 때 눈에 띄는 억양이 있고, 프랑스어와 같은 다른 언어를 번역할 때는 완벽한 미국식 억양으로 말합니다.

음성 대 음성 번역 및 자동 음성 인식의 예가 포함된 AudioPaLM 모델.

AI에 대해 자세히 알아보기:

책임 부인

줄 안 트러스트 프로젝트 지침, 이 페이지에 제공된 정보는 법률, 세금, 투자, 재정 또는 기타 형태의 조언을 제공하기 위한 것이 아니며 해석되어서도 안 됩니다. 손실을 감수할 수 있는 만큼만 투자하고 의심스러운 경우 독립적인 재정 조언을 구하는 것이 중요합니다. 자세한 내용은 이용약관은 물론 발행자나 광고주가 제공하는 도움말 및 지원 페이지를 참조하시기 바랍니다. MetaversePost 는 정확하고 편견 없는 보고를 위해 최선을 다하고 있지만 시장 상황은 예고 없이 변경될 수 있습니다.

저자에 관하여

Damir는 팀 리더, 제품 관리자 및 편집자입니다. Metaverse Post, AI/ML, AGI, LLM, Metaverse 및 Web3-관련 분야. 그의 기사는 매달 백만 명이 넘는 사용자의 엄청난 청중을 끌어들입니다. 그는 SEO 및 디지털 마케팅 분야에서 10년의 경험을 가진 전문가로 보입니다. Damir는 Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto 및 기타 간행물. UAE, 터키, 러시아, CIS를 오가며 디지털 유목민으로 활동하고 있습니다. Damir는 끊임없이 변화하는 인터넷 환경에서 성공하는 데 필요한 비판적 사고 기술을 제공했다고 믿는 물리학 학사 학위를 받았습니다. 

더 많은 기사
다미르 얄랄로프
다미르 얄랄로프

Damir는 팀 리더, 제품 관리자 및 편집자입니다. Metaverse Post, AI/ML, AGI, LLM, Metaverse 및 Web3-관련 분야. 그의 기사는 매달 백만 명이 넘는 사용자의 엄청난 청중을 끌어들입니다. 그는 SEO 및 디지털 마케팅 분야에서 10년의 경험을 가진 전문가로 보입니다. Damir는 Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto 및 기타 간행물. UAE, 터키, 러시아, CIS를 오가며 디지털 유목민으로 활동하고 있습니다. Damir는 끊임없이 변화하는 인터넷 환경에서 성공하는 데 필요한 비판적 사고 기술을 제공했다고 믿는 물리학 학사 학위를 받았습니다. 

Hot Stories
뉴스레터에 가입하세요.
최신 뉴스

변동성 속에서 비트코인 ​​ETF를 향한 기관의 선호도 증가

13F 서류를 통한 공개를 통해 주목할만한 기관 투자자들이 비트코인 ​​ETF에 손을 대고 있음이 드러났으며, 이는 비트코인 ​​ETF에 대한 수용이 증가하고 있음을 강조합니다.

현장 사진

선고일이 다가왔습니다: 미국 법원이 DOJ의 주장을 고려함에 따라 CZ의 운명이 균형을 이루고 있습니다.

자오창펑(Changpeng Zhao)은 오늘 시애틀의 미국 법원에서 선고를 받을 예정이다.

현장 사진
혁신적인 기술 커뮤니티에 참여하세요
상세 보기
자세히 보기
ZKP 기반 인프라 프로토콜 ZKBase, 로드맵 공개, 5월 테스트넷 출시 계획
뉴스 보도 Technology
ZKP 기반 인프라 프로토콜 ZKBase, 로드맵 공개, 5월 테스트넷 출시 계획
2024 년 5 월 9 일
BLOCKCHANCE와 CONF3RENCE가 독일 최대 규모를 위해 통합되었습니다. Web3 도르트문트 회의
근무지에서 발생 시장 소프트웨어 이야기와 리뷰 Technology
BLOCKCHANCE와 CONF3RENCE가 독일 최대 규모를 위해 통합되었습니다. Web3 도르트문트 회의
2024 년 5 월 9 일
NuLink가 Bybit에서 출시되었습니다 Web3 IDO 플랫폼. 구독 기간이 13월 XNUMX일까지 연장됩니다
시장 뉴스 보도 Technology
NuLink가 Bybit에서 출시되었습니다 Web3 IDO 플랫폼. 구독 기간이 13월 XNUMX일까지 연장됩니다
2024 년 5 월 9 일
UXLINK와 Binance는 사용자에게 20천만 UXUY 포인트를 제공하는 새로운 캠페인을 위해 협력합니다. Airdrop 보상
시장 뉴스 보도 Technology
UXLINK와 Binance는 사용자에게 20천만 UXUY 포인트를 제공하는 새로운 캠페인을 위해 협력합니다. Airdrop 보상
2024 년 5 월 9 일
CRYPTOMERIA LABS PTE. LTD.