Relatório de notícias Tecnologia
25 de Setembro de 2023

OpenAI'S ChatGPT Revela grande atualização, adiciona conversação por voz e bate-papo por imagem

Em Breve

OpenAI lançará novos recursos de voz e imagem em ChatGPT nas próximas duas semanas.

Esses recursos estarão disponíveis apenas para usuários Plus e Enterprise.

OpenAI anunciou hoje que lançará novos recursos de voz e imagem em ChatGPT. Os novos recursos permitirão que os usuários tenham uma conversa por voz com ChatGPT ou converse com o chatbot através de imagens.

O anúncio segue reivindicações de usuários do Reddit que alegaram ter obtido acesso a OpenAImodelos e posteriormente compartilhou essas informações na plataforma. Redditor FeltSteam descreveu um modelo de IA com o nome provisório de Arrakis, que supostamente permite aos usuários “inserir qualquer combinação de texto, áudio e vídeo”.

“A nova capacidade de voz é alimentada por um novo modelo de conversão de texto em fala, capaz de gerar áudio semelhante ao humano a partir de apenas texto e alguns segundos de amostra de fala”, escreveu Open AI em um comunicado. no blog. “Colaboramos com dubladores profissionais para criar cada uma das vozes. Também usamos o Whisper, nosso sistema de reconhecimento de fala de código aberto, para transcrever suas palavras faladas em texto.”

Com os novos recursos, os usuários podem conversar com ChatGPT usando suas vozes. Eles também podem discutir imagens com o chatbot. Os recursos serão lançados nas próximas duas semanas para usuários Plus e Enterprise.

O recurso de voz chegará ao iOS e Android como opcional, enquanto o recurso de imagem estará disponível em todas as plataformas.

Para começar a usar a função de voz, os usuários podem acessar Configurações → Novos recursos no aplicativo móvel e optar por “conversas de voz”. Em seguida, o usuário deve tocar no botão do fone de ouvido localizado no canto superior direito da tela inicial e selecionar sua voz preferida entre uma seleção de cinco vozes diferentes.

Para conversar com ChatGPT por meio de imagens, o usuário pode tocar no botão de foto para capturar uma imagem ou selecionar uma. Se estiver usando iOS ou Android, toque no botão de adição antes de continuar. Além disso, eles podem participar de discussões com várias imagens ou usá-las para orientar o chatbot.

OpenAI diz que a compreensão da imagem é alimentada por multimodal GPT-3. 5 e GPT-4. Esses modelos aproveitam as habilidades de raciocínio linguístico para analisar uma gama diversificada de conteúdo visual, abrangendo fotografias, capturas de tela e documentos contendo uma combinação de texto e imagens.

OpenAIparceria com Spotify

Spotify também Anunciou hoje seu recurso de tradução de voz com tecnologia de IA. O novo recurso pode traduzir podcasts para diferentes idiomas, utilizando a voz original do podcaster.

De acordo com o The Verge, esse recurso de tradução depende de OpenAIferramenta de transcrição de voz do Whisper, que é capaz de transcrever a fala em inglês e traduzir vários idiomas para o inglês.

Como parte do piloto, a empresa se uniu aos podcasters Dax Shepard, Monica Padman, Lex Fridman, Bill Simmons e Steven Bartlett para criar traduções de voz baseadas em IA em idiomas como espanhol, francês e alemão para episódios específicos do catálogo e futuros lançamentos.

“Acreditamos que uma abordagem cuidadosa à IA pode ajudar a construir conexões mais profundas entre ouvintes e criadores, um componente-chave da missão do Spotify de desbloquear o potencial da criatividade humana”, disse Ziad Sultan, vice-presidente de Personalização do Spotify, em comunicado.

Episódios traduzidos por voz dos criadores do piloto estarão disponíveis em todo o mundo para usuários Premium e Gratuitos.

Aviso Legal

Em linha com a Diretrizes do Projeto Trust, observe que as informações fornecidas nesta página não se destinam e não devem ser interpretadas como aconselhamento jurídico, tributário, de investimento, financeiro ou qualquer outra forma. É importante investir apenas o que você pode perder e procurar aconselhamento financeiro independente se tiver alguma dúvida. Para mais informações, sugerimos consultar os termos e condições, bem como as páginas de ajuda e suporte fornecidas pelo emissor ou anunciante. MetaversePost está comprometida com relatórios precisos e imparciais, mas as condições de mercado estão sujeitas a alterações sem aviso prévio.

Sobre o autor

Cindy é jornalista da Metaverse Post, abordando temas relacionados web3, NFT, metaverso e IA, com foco em entrevistas com Web3 players da indústria. Ela conversou com mais de 30 executivos de nível C e continua aumentando, trazendo seus valiosos insights aos leitores. Originária de Cingapura, Cindy agora mora em Tbilisi, na Geórgia. Ela é bacharel em Estudos de Comunicação e Mídia pela University of South Australia e tem uma década de experiência em jornalismo e redação. Entre em contato com ela através [email protegido] com arremessos de imprensa, anúncios e oportunidades de entrevista.

Mais artigos
Cindy Tan
Cindy Tan

Cindy é jornalista da Metaverse Post, abordando temas relacionados web3, NFT, metaverso e IA, com foco em entrevistas com Web3 players da indústria. Ela conversou com mais de 30 executivos de nível C e continua aumentando, trazendo seus valiosos insights aos leitores. Originária de Cingapura, Cindy agora mora em Tbilisi, na Geórgia. Ela é bacharel em Estudos de Comunicação e Mídia pela University of South Australia e tem uma década de experiência em jornalismo e redação. Entre em contato com ela através [email protegido] com arremessos de imprensa, anúncios e oportunidades de entrevista.

Hot Stories
Junte-se ao nosso boletim informativo.
Últimas notícias

Cresce apetite institucional por ETFs de Bitcoin em meio à volatilidade

As divulgações por meio de registros 13F revelam investidores institucionais notáveis ​​​​que se envolvem em ETFs Bitcoin, ressaltando uma aceitação crescente de ...

Saber Mais

Chega o dia da sentença: o destino de CZ está em equilíbrio enquanto o tribunal dos EUA considera o apelo do DOJ

Changpeng Zhao está prestes a ser condenado hoje em um tribunal dos EUA em Seattle.

Saber Mais
Junte-se à nossa comunidade tecnológica inovadora
Saiba Mais
Saiba mais
Nexo inicia 'The Hunt' para recompensar usuários com US$ 12 milhões em tokens NEXO por se envolverem com seu ecossistema
Mercados Relatório de notícias Tecnologia
Nexo inicia 'The Hunt' para recompensar usuários com US$ 12 milhões em tokens NEXO por se envolverem com seu ecossistema
8 de maio de 2024
Revolut X Exchange da Revolut atrai comerciantes de criptografia com taxas zero de fabricante e análises avançadas
Mercados Software Histórias e resenhas Tecnologia
Revolut X Exchange da Revolut atrai comerciantes de criptografia com taxas zero de fabricante e análises avançadas
8 de maio de 2024
Plataforma de negociação de criptografia BitMEX estreia negociação de opções com 0 taxas e incentivos em dinheiro
O negócio Mercados Relatório de notícias
Plataforma de negociação de criptografia BitMEX estreia negociação de opções com 0 taxas e incentivos em dinheiro
8 de maio de 2024
Lisk faz transição oficial para Ethereum Layer 2 e revela Core v4.0.6
Relatório de notícias Tecnologia
Lisk faz transição oficial para Ethereum Layer 2 e revela Core v4.0.6
8 de maio de 2024
CRYPTOMERIA LABS PTE. LTDA.