뉴스 보도 Technology
2023 년 9 월 25 일

OpenAI의 ChatGPT 주요 업그레이드 공개, 음성 대화 및 이미지 채팅 추가

요컨대

OpenAI 새로운 음성 및 이미지 기능을 출시할 예정입니다. ChatGPT 앞으로 XNUMX주 동안.

이러한 기능은 Plus 및 Enterprise 사용자에게만 제공됩니다.

OpenAI 오늘은 새로운 음성 및 이미지 기능을 출시할 것이라고 발표했습니다. ChatGPT. 새로운 기능을 통해 사용자는 음성 대화를 할 수 있습니다. ChatGPT 또는 이미지를 통해 챗봇과 채팅을 해보세요.

이번 발표는 Reddit 사용자가 다음 항목에 대한 액세스 권한을 얻었다고 주장한 후에 나온 것입니다. OpenAI의 모델을 소개하고 이후에 이 정보를 플랫폼에서 공유했습니다. Reddit 사용자 FeltSteam은 사용자가 "텍스트, 오디오 및 비디오의 모든 조합을 입력"할 수 있는 Arrakis라는 실명을 가진 AI 모델을 설명했습니다.

"새로운 음성 기능은 새로운 텍스트 음성 변환 모델을 기반으로 하며, 텍스트와 몇 초의 샘플 음성만으로 인간과 유사한 오디오를 생성할 수 있습니다."라고 Open AI는 밝혔습니다. 블로그 게시물. “우리는 전문 성우들과 협력하여 각각의 목소리를 만들었습니다. 우리는 또한 오픈 소스 음성 인식 시스템인 Whisper를 사용하여 사용자가 말한 내용을 텍스트로 변환합니다."

새로운 기능을 통해 사용자는 다음과 같은 대화에 참여할 수 있습니다. ChatGPT 그들의 목소리를 사용합니다. 챗봇과 함께 이미지에 대한 토론도 할 수 있습니다. 이 기능은 앞으로 XNUMX주에 걸쳐 Plus 및 Enterprise 사용자에게 출시될 예정입니다.

음성 기능은 iOS 및 Android에 선택적으로 제공되며 이미지 기능은 모든 플랫폼에서 사용할 수 있습니다.

음성 기능을 사용하려면 모바일 앱에서 설정 → 새로운 기능으로 이동하여 '음성 대화'를 선택하면 됩니다. 다음으로, 사용자는 홈 화면 오른쪽 상단에 있는 헤드폰 버튼을 누르고 XNUMX가지 음성 중에서 원하는 음성을 선택해야 합니다.

대화하다 ChatGPT 이미지를 통해 사용자는 사진 버튼을 탭하여 이미지를 캡처하거나 선택할 수 있습니다. iOS 또는 Android를 사용하는 경우 계속하기 전에 더하기 버튼을 탭하세요. 또한 여러 이미지로 토론에 참여하거나 이를 사용하여 챗봇을 안내할 수 있습니다.

OpenAI 이미지 이해는 다중 모드에 의해 구동된다고 말합니다. GPT-3.5 및 GPT-4. 이러한 모델은 언어 추론 능력을 활용하여 사진, 스크린샷, 텍스트와 이미지의 조합이 포함된 문서 등 다양한 시각적 콘텐츠를 분석합니다.

OpenAISpotify와의 파트너십

스포티파이도 오늘 발표 AI 기반 음성 번역 기능. 새로운 기능은 팟캐스터의 원래 음성을 활용하여 팟캐스트를 다른 언어로 번역할 수 있습니다.

에 따르면 직전, 이 번역 기능은 다음에 의존합니다. OpenAI의 음성 전사 도구인 Whisper는 영어 음성을 전사하고 다양한 언어를 영어로 번역할 수 있습니다.

파일럿의 일환으로 회사는 팟캐스터 Dax Shepard, Monica Padman, Lex Fridman, Bill Simmons 및 Steven Bartlett과 협력하여 특정 카탈로그 에피소드 및 향후에 대해 스페인어, 프랑스어, 독일어와 같은 언어로 AI 기반 음성 번역을 만들었습니다. 릴리스.

Spotify의 개인화 부문 부사장인 Ziad Sultan은 성명을 통해 “우리는 AI에 대한 사려 깊은 접근 방식이 청취자와 창작자 사이에 더 깊은 연결을 구축하는 데 도움이 될 수 있다고 믿습니다. 이는 인간 창의성의 잠재력을 실현하려는 Spotify 사명의 핵심 요소입니다.”라고 말했습니다.

파일럿 제작자의 음성 번역 에피소드는 전 세계 프리미엄 및 무료 사용자에게 제공됩니다.

책임 부인

줄 안 트러스트 프로젝트 지침, 이 페이지에 제공된 정보는 법률, 세금, 투자, 재정 또는 기타 형태의 조언을 제공하기 위한 것이 아니며 해석되어서도 안 됩니다. 손실을 감수할 수 있는 만큼만 투자하고 의심스러운 경우 독립적인 재정 조언을 구하는 것이 중요합니다. 자세한 내용은 이용약관은 물론 발행자나 광고주가 제공하는 도움말 및 지원 페이지를 참조하시기 바랍니다. MetaversePost 는 정확하고 편견 없는 보고를 위해 최선을 다하고 있지만 시장 상황은 예고 없이 변경될 수 있습니다.

저자에 관하여

Cindy는 언론인입니다. Metaverse Post, 관련 주제를 다루는 web3, NFT, metaverse 및 AI, 인터뷰를 중심으로 Web3 업계 플레이어. 그녀는 30명이 넘는 최고 경영진과 이야기를 나누며 그들의 귀중한 통찰력을 독자들에게 전했습니다. 원래 싱가포르 출신인 Cindy는 현재 조지아주 트빌리시에 거주하고 있습니다. 그녀는 사우스 오스트레일리아 대학에서 커뮤니케이션 및 미디어 연구 학사 학위를 취득했으며 저널리즘과 글쓰기 분야에서 XNUMX년 간의 경험을 갖고 있습니다. 다음을 통해 그녀에게 연락하세요. [이메일 보호] 보도 자료, 발표 및 인터뷰 기회가 있습니다.

더 많은 기사
신디 탄
신디 탄

Cindy는 언론인입니다. Metaverse Post, 관련 주제를 다루는 web3, NFT, metaverse 및 AI, 인터뷰를 중심으로 Web3 업계 플레이어. 그녀는 30명이 넘는 최고 경영진과 이야기를 나누며 그들의 귀중한 통찰력을 독자들에게 전했습니다. 원래 싱가포르 출신인 Cindy는 현재 조지아주 트빌리시에 거주하고 있습니다. 그녀는 사우스 오스트레일리아 대학에서 커뮤니케이션 및 미디어 연구 학사 학위를 취득했으며 저널리즘과 글쓰기 분야에서 XNUMX년 간의 경험을 갖고 있습니다. 다음을 통해 그녀에게 연락하세요. [이메일 보호] 보도 자료, 발표 및 인터뷰 기회가 있습니다.

Hot Stories
뉴스레터에 가입하세요.
최신 뉴스

Ripple에서 Big Green DAO까지: 암호화폐 프로젝트가 자선 활동에 기여하는 방법

자선 활동을 위해 디지털 통화의 잠재력을 활용하는 이니셔티브를 살펴보겠습니다.

현장 사진

AlphaFold 3, Med-Gemini 등: 2024년 AI가 의료를 혁신하는 방식

AI는 새로운 유전적 상관관계를 밝히는 것부터 로봇 수술 시스템을 강화하는 것까지 의료 분야에서 다양한 방식으로 나타납니다.

현장 사진
혁신적인 기술 커뮤니티에 참여하세요
상세 보기
자세히 보기
콘텐츠 제작, 비디오 편집 등을 위한 상위 10가지 무료 AI 도구
AI Wiki 요람 교육 생활 소프트웨어 Technology
콘텐츠 제작, 비디오 편집 등을 위한 상위 10가지 무료 AI 도구
2024 년 5 월 14 일
홍콩 증권위원회, 암호화폐 산업을 표적으로 삼은 딥페이크 사기 경고: 투자자 안전에 미치는 영향
생활 보안 Wiki 소프트웨어 이야기와 리뷰 Technology
홍콩 증권위원회, 암호화폐 산업을 표적으로 삼은 딥페이크 사기 경고: 투자자 안전에 미치는 영향
2024 년 5 월 14 일
Ripple과 Evmos는 EvmOS 기술을 사용하여 XRP Ledger EVM 사이드체인 개발에 협력합니다.
근무지에서 발생 뉴스 보도 Technology
Ripple과 Evmos는 EvmOS 기술을 사용하여 XRP Ledger EVM 사이드체인 개발에 협력합니다.
2024 년 5 월 14 일
5ireChain은 네트워크 스트레스 테스트를 위해 인센티브를 제공하는 'Testnet Thunder: GA'를 시작하고 사용자를 초대합니다. Airdrop 보상
뉴스 보도 Technology
5ireChain은 네트워크 스트레스 테스트를 위해 인센티브를 제공하는 'Testnet Thunder: GA'를 시작하고 사용자를 초대합니다. Airdrop 보상
2024 년 5 월 14 일
CRYPTOMERIA LABS PTE. LTD.