뉴스 보도 기술
2023 년 11 월 07 일

속삭임 V3 OpenAI 오픈 소스로 전환하여 언어 간 음성 인식 확장

요컨대

OpenAI 는 다국어 음성 인식을 위한 최첨단 모델인 WHISPER V3의 오픈 소스 릴리스를 발표했습니다.

OpenAI Whisper V3 공개: 언어 간 음성 인식 혁명

인공지능(AI) 연구 기업 OpenAI는 최첨단 모델을 오픈소스화하여 음성 인식 분야에서 큰 도약을 이루었습니다. 속삭임 대형-v3, 개발자의 날 행사 중.

Whisper 모델의 최신 버전은 다양한 언어의 음성을 이해하고 전사하는 놀라운 능력을 보여주며 과거의 영어 중심 모델을 넘어 적용 가능성을 넓혀줍니다.

Whisper Large-v3는 다양한 조건에서 번창하며 다양한 언어 입력을 능숙하게 처리합니다. 에 따르면 OpenAI, 다음과 같은 영어 응용 프로그램을 대상으로 하는 모델은 tiny.enbase.en 월등한 성능을 보여줍니다. 그러나 Whisper Large-v3의 효과는 변환되는 언어에 따라 변동될 수 있습니다.

원래 지난 2월 출시 당시 영어에 초점을 맞춘 이 모델은 XNUMX월 버전 XNUMX로 기능을 확장하여 다양한 언어에 대한 지원을 포함시켰지만 어떤 언어인지는 명시하지 않았습니다.

다음의 허용 라이선스에 따라 Whisper Large-v3을 사용할 수 있습니다. GitHub의를 사용하면 사용자가 동급 최고의 정확도로 다양한 형태의 콘텐츠를 전사할 수 있습니다. 고유한 타임스탬프 기능은 상당한 가치를 더해 다음과 같은 비디오 플랫폼에서 자막 생성에 혁명을 일으킬 가능성이 있습니다. 유튜브.

속삭임 V3 OpenAI 오픈 소스로 전환하여 언어 간 음성 인식 확장
출처: OpenAI

OpenAI의 다국어 음성 인식 혁신

Whisper Large-v3는 먼저 오디오를 30초 길이의 클립으로 분할한 다음 인코더와 디코더가 포함된 복잡한 시스템을 통해 실행하여 출력을 생성하는 방식으로 오디오를 처리합니다.

이러한 구성 요소는 조화롭게 작동하여 음성 단어의 텍스트 전사를 예측합니다. Whisper Large-v3의 기술적인 특징 중 하나는 다국어 음성을 기록할 뿐만 아니라 영어로 번역하는 언어 식별 기능입니다.

초기 계획에서는 대중적인 제품과의 통합을 제안했지만 ChatGPT 챗봇과의 직접적인 음성 상호 작용을 촉진하기 위해 OpenAI Whisper Large-v3에 대중에게 직접 액세스 권한을 부여하기로 결정했습니다. 현재 Whisper의 대상 독자가 일반 대중이 아닌 주로 연구자라는 점은 주목할 가치가 있습니다.

OpenAI강력한 음성 처리를 발전시키려는 의 노력은 Whisper Large-v3를 오픈 소스로 결정한 것에서 분명하게 드러납니다. 이 조직은 이 분야의 실제 응용 프로그램 개발과 추가 연구를 촉진한다는 목표를 강조합니다.

OpenAI 영어가 아닌 오디오의 상당 부분을 포함하여 인터넷에서 수집한 680,000시간의 면밀히 모니터링된 데이터를 포함하는 방대한 데이터 세트로 AI 도구를 개선했습니다. 이 단계는 혁신을 촉진하고 전 세계적으로 음성 인식 기술의 범위를 넓히는 것을 목표로 합니다.

책임 한계

줄 안 트러스트 프로젝트 지침, 이 페이지에 제공된 정보는 법률, 세금, 투자, 재정 또는 기타 형태의 조언을 제공하기 위한 것이 아니며 해석되어서도 안 됩니다. 손실을 감수할 수 있는 만큼만 투자하고 의심스러운 경우 독립적인 재정 조언을 구하는 것이 중요합니다. 자세한 내용은 이용약관은 물론 발행자나 광고주가 제공하는 도움말 및 지원 페이지를 참조하시기 바랍니다. MetaversePost 는 정확하고 편견 없는 보고를 위해 최선을 다하고 있지만 시장 상황은 예고 없이 변경될 수 있습니다.

저자에 관하여

Nik은 뛰어난 분석가이자 작가입니다. Metaverse Post, 특히 AI/ML, XR, VR, 온체인 분석 및 블록체인 개발에 중점을 두고 급변하는 기술 세계에 대한 최첨단 통찰력을 제공하는 것을 전문으로 합니다. 그의 기사는 다양한 청중을 참여시키고 정보를 제공하여 그들이 기술 곡선보다 앞서 나갈 수 있도록 돕습니다. 경제 및 관리 석사 학위를 보유한 Nik은 비즈니스 세계의 뉘앙스와 신기술과의 교차점을 확실히 이해하고 있습니다.

더 많은 기사
닉 아스티
닉 아스티

Nik은 뛰어난 분석가이자 작가입니다. Metaverse Post, 특히 AI/ML, XR, VR, 온체인 분석 및 블록체인 개발에 중점을 두고 급변하는 기술 세계에 대한 최첨단 통찰력을 제공하는 것을 전문으로 합니다. 그의 기사는 다양한 청중을 참여시키고 정보를 제공하여 그들이 기술 곡선보다 앞서 나갈 수 있도록 돕습니다. 경제 및 관리 석사 학위를 보유한 Nik은 비즈니스 세계의 뉘앙스와 신기술과의 교차점을 확실히 이해하고 있습니다.

Hot Stories

Bitwise, 미국 대선 결과 추종 예측 ETF 출시 예정

by 알리사 데이비슨
2026년 2월 18일
뉴스레터에 가입하세요.
최신 뉴스

Bitwise, 미국 대선 결과 추종 예측 ETF 출시 예정

by 알리사 데이비슨
2026년 2월 18일

솔라나 폭풍 전의 고요: 차트, 고래, 온체인 신호가 지금 말하고 있는 것

솔라나는 채택 증가, 기관적 관심, 핵심 파트너십에 힘입어 강력한 성과를 보였지만, 잠재적인 어려움에 직면해 있습니다.

현장 사진

2025년 XNUMX월 암호화폐: 주요 트렌드, 변화, 그리고 앞으로의 전망

2025년 XNUMX월, 암호화폐 분야는 핵심 인프라 강화에 집중했고, 이더리움은 Pectra를 준비했습니다.

현장 사진
자세히 보기
더보기
Meta와 NVIDIA, 대규모 인프라 확장을 위한 수백만 개의 AI 칩 공급 다년간 계약 체결
근무지에서 발생 뉴스 보도 기술
Meta와 NVIDIA, 대규모 인프라 확장을 위한 수백만 개의 AI 칩 공급 다년간 계약 체결
2026년 2월 18일
Anthropic은 거의 대작에 버금가는 성능과 확장된 장기 컨텍스트 기능을 제공하는 Claude Sonnet 4.6을 공개했습니다.
근무지에서 발생 뉴스 보도 기술
Anthropic은 거의 대작에 버금가는 성능과 확장된 장기 컨텍스트 기능을 제공하는 Claude Sonnet 4.6을 공개했습니다.
2026년 2월 18일
MEXC, 유연한 암호화폐 수익 경쟁 심화에 따라 수익률 및 대출 옵션 확대
근무지에서 발생 뉴스 보도
MEXC, 유연한 암호화폐 수익 경쟁 심화에 따라 수익률 및 대출 옵션 확대
2026년 2월 18일
Bitwise, 미국 대선 결과 추종 예측 ETF 출시 예정
근무지에서 발생 뉴스 보도 기술
Bitwise, 미국 대선 결과 추종 예측 ETF 출시 예정
2026년 2월 18일
CRYPTOMERIA LABS PTE. LTD.