OpenAI'S ChatGPT Revela grande atualização, adiciona conversação por voz e bate-papo por imagem
Em Breve
OpenAI lançará novos recursos de voz e imagem em ChatGPT nas próximas duas semanas.
Esses recursos estarão disponíveis apenas para usuários Plus e Enterprise.
OpenAI anunciou hoje que lançará novos recursos de voz e imagem em ChatGPT. Os novos recursos permitirão que os usuários tenham uma conversa por voz com ChatGPT ou converse com o chatbot através de imagens.
O anúncio segue reivindicações de usuários do Reddit que alegaram ter obtido acesso a OpenAImodelos e posteriormente compartilhou essas informações na plataforma. Redditor FeltSteam descreveu um modelo de IA com o nome provisório de Arrakis, que supostamente permite aos usuários “inserir qualquer combinação de texto, áudio e vídeo”.
“A nova capacidade de voz é alimentada por um novo modelo de conversão de texto em fala, capaz de gerar áudio semelhante ao humano a partir de apenas texto e alguns segundos de amostra de fala”, escreveu Open AI em um comunicado. no blog. “Colaboramos com dubladores profissionais para criar cada uma das vozes. Também usamos o Whisper, nosso sistema de reconhecimento de fala de código aberto, para transcrever suas palavras faladas em texto.”
Encontrei algumas especulações estranhas não confirmadas sobre modelos internos poderosos no Reddit.
- Yam Peleg (@Yampeleg) 25 de Setembro de 2023
– Por favor, leve tudo com cautela. –
Aparentemente,
Dois usuários diferentes afirmam ter acesso a OpenAImodelos internos da e estão compartilhando informações no reddit.
FeltroSteam… pic.twitter.com/JRJH4xADZX
Com os novos recursos, os usuários podem conversar com ChatGPT usando suas vozes. Eles também podem discutir imagens com o chatbot. Os recursos serão lançados nas próximas duas semanas para usuários Plus e Enterprise.
O recurso de voz chegará ao iOS e Android como opcional, enquanto o recurso de imagem estará disponível em todas as plataformas.
Para começar a usar a função de voz, os usuários podem acessar Configurações → Novos recursos no aplicativo móvel e optar por “conversas de voz”. Em seguida, o usuário deve tocar no botão do fone de ouvido localizado no canto superior direito da tela inicial e selecionar sua voz preferida entre uma seleção de cinco vozes diferentes.
Para conversar com ChatGPT por meio de imagens, o usuário pode tocar no botão de foto para capturar uma imagem ou selecionar uma. Se estiver usando iOS ou Android, toque no botão de adição antes de continuar. Além disso, eles podem participar de discussões com várias imagens ou usá-las para orientar o chatbot.
OpenAI diz que a compreensão da imagem é alimentada por multimodal GPT-3. 5 e GPT-4. Esses modelos aproveitam as habilidades de raciocínio linguístico para analisar uma gama diversificada de conteúdo visual, abrangendo fotografias, capturas de tela e documentos contendo uma combinação de texto e imagens.
OpenAIparceria com Spotify
Spotify também Anunciou hoje seu recurso de tradução de voz com tecnologia de IA. O novo recurso pode traduzir podcasts para diferentes idiomas, utilizando a voz original do podcaster.
De acordo com o The Verge, esse recurso de tradução depende de OpenAIferramenta de transcrição de voz do Whisper, que é capaz de transcrever a fala em inglês e traduzir vários idiomas para o inglês.
Como parte do piloto, a empresa se uniu aos podcasters Dax Shepard, Monica Padman, Lex Fridman, Bill Simmons e Steven Bartlett para criar traduções de voz baseadas em IA em idiomas como espanhol, francês e alemão para episódios específicos do catálogo e futuros lançamentos.
“Acreditamos que uma abordagem cuidadosa à IA pode ajudar a construir conexões mais profundas entre ouvintes e criadores, um componente-chave da missão do Spotify de desbloquear o potencial da criatividade humana”, disse Ziad Sultan, vice-presidente de Personalização do Spotify, em comunicado.
Episódios traduzidos por voz dos criadores do piloto estarão disponíveis em todo o mundo para usuários Premium e Gratuitos.
Aviso Legal
Em linha com a Diretrizes do Projeto Trust, observe que as informações fornecidas nesta página não se destinam e não devem ser interpretadas como aconselhamento jurídico, tributário, de investimento, financeiro ou qualquer outra forma. É importante investir apenas o que você pode perder e procurar aconselhamento financeiro independente se tiver alguma dúvida. Para mais informações, sugerimos consultar os termos e condições, bem como as páginas de ajuda e suporte fornecidas pelo emissor ou anunciante. MetaversePost está comprometida com relatórios precisos e imparciais, mas as condições de mercado estão sujeitas a alterações sem aviso prévio.
Sobre o autor
Cindy é jornalista da Metaverse Post, abordando temas relacionados web3, NFT, metaverso e IA, com foco em entrevistas com Web3 players da indústria. Ela conversou com mais de 30 executivos de nível C e continua aumentando, trazendo seus valiosos insights aos leitores. Originária de Cingapura, Cindy agora mora em Tbilisi, na Geórgia. Ela é bacharel em Estudos de Comunicação e Mídia pela University of South Australia e tem uma década de experiência em jornalismo e redação. Entre em contato com ela através [email protegido] com arremessos de imprensa, anúncios e oportunidades de entrevista.
Mais artigosCindy é jornalista da Metaverse Post, abordando temas relacionados web3, NFT, metaverso e IA, com foco em entrevistas com Web3 players da indústria. Ela conversou com mais de 30 executivos de nível C e continua aumentando, trazendo seus valiosos insights aos leitores. Originária de Cingapura, Cindy agora mora em Tbilisi, na Geórgia. Ela é bacharel em Estudos de Comunicação e Mídia pela University of South Australia e tem uma década de experiência em jornalismo e redação. Entre em contato com ela através [email protegido] com arremessos de imprensa, anúncios e oportunidades de entrevista.