Relatório de notícias Equipar
15 de março de 2023

GPT-4 Pode atender às suas solicitações de imagens, documentos, diagramas e capturas de tela

Em Breve

GPT-4 pode lidar com solicitações de imagens, documentos, diagramas e capturas de tela. É uma melhoria em relação GPT-3, que tratava apenas de texto.

GPT-4 tem desempenho superior em diversos exames e testes e pode acessar informações e detalhes adicionais por meio de imagens que podem não estar disponíveis na forma escrita.

gpt-4 imagens documentos capturas de tela

OpenAImais recente marco da empresa, o novo modelo GPT-4, pode aceitar solicitações que incluam imagens, documentos com texto, diagramas ou capturas de tela como entradas. Isto representa uma melhoria significativa em relação à versão anterior, GPT-3, que só poderia compreender e gerar texto. Com esse novo recurso, GPT-4 gera saídas de texto com entradas que consistem em texto e imagens intercalados.

“Em vários domínios – incluindo documentos com texto e fotografias, diagramas ou capturas de tela –GPT-4 exibe recursos semelhantes aos de entradas somente de texto”,

OpenAI escrevi.

ChatGPT-4 possui tamanho maior que seus antecessores, indicando que passou por treinamento em uma quantidade maior de dados e contém mais pesos em seu arquivo de modelo, resultando em um custo maior para sua operação. A mais nova linguagem de IA pode gerar texto semelhante ao humano usando deep learning e sendo pré-treinado em um grande conjunto de dados.

GPT-4 tem desempenho superior demonstrado em relação a outras linguagens de IA em uma variedade de exames e testes devido, em parte, à sua capacidade de acessar informações e detalhes adicionais por meio de imagens que podem não estar disponíveis por escrito.

O novo GPT-4 O modelo pode dizer exatamente o que está representado na ilustração, analisá-lo e até explicar seu significado. Na demonstração, GPT-4 explicou a piada visual onde um cabo VGA é conectado ao iPhone. Também poderia explicar o que há de incomum em uma imagem de “passagem extrema”, que você confere abaixo.

gpt-4 imagens
Fonte: OpenAI

No entanto, também existem implicações mais úteis para GPT-4conhecimento recém-adquirido. Na apresentação, foi demonstrado que o PGT-4 sabia dizer o que poderia ser cozinhado a partir dos ingredientes mostrados na imagem. Isso significa que o modelo pode ajudá-lo a cozinhar se você tiver produtos alimentícios e não tiver ideia do que fazer com eles. Tire uma foto da comida que você tem e converse-GPT posso dizer o que você pode preparar com os ingredientes que tem em casa.

Essa capacidade de compreender e interpretar informações visuais torna GPT-4 uma ferramenta poderosa para tarefas como legendagem de imagens, resposta visual a perguntas e até criação de conteúdo. Com a integração da compreensão textual e visual, GPT-4 tem o potencial de revolucionar vários setores, como publicidade, design e comércio eletrônico, e ajudar as pessoas a realizar tarefas chatas e mundanas para elas.

O avançado modelo de linguagem também 'compreende' capturas de tela e documentos com texto, tabelas, diagramas ou outras representações visuais. Por exemplo, se você enviar um artigo de pesquisa de três páginas e precisar que ele seja resumido e explicado, GPT-4 é capaz de fazer isso. 

O âncora da Bloomberg, Jon Erlichman, demonstrou como conseguiu transformar um design desenhado à mão em um site funcional.

A nova tecnologia também pode ser usada como auxiliar de mobilidade, pois pode ser usada para descrever o ambiente para pessoas com deficiência visual. Para isso, a Open AI já firmou parceria com um aplicativo chamado Seja meus olhos que foi concebido para ajudar os cegos quando precisam de olhar para alguma coisa, por exemplo, durante as compras. O aplicativo permite que “voluntários e profissionais com visão emprestem seus olhos para resolver tarefas grandes e pequenas para ajudar pessoas cegas e com baixa visão a levar uma vida mais independente”. Agora, também oferece uma ferramenta de voluntariado virtual alimentada por OpenAI'S GPT-4.

Apesar OpenAI'S GPT-4 atualmente oferece a capacidade de processar texto e imagens como entradas, o modelo ainda não está equipado para lidar com entradas de áudio e vídeo. No entanto, há indicações de que estas modalidades poderão ser incluídas na próxima iteração da tecnologia.

Leia mais:

Aviso Legal

Em linha com a Diretrizes do Projeto Trust, observe que as informações fornecidas nesta página não se destinam e não devem ser interpretadas como aconselhamento jurídico, tributário, de investimento, financeiro ou qualquer outra forma. É importante investir apenas o que você pode perder e procurar aconselhamento financeiro independente se tiver alguma dúvida. Para mais informações, sugerimos consultar os termos e condições, bem como as páginas de ajuda e suporte fornecidas pelo emissor ou anunciante. MetaversePost está comprometida com relatórios precisos e imparciais, mas as condições de mercado estão sujeitas a alterações sem aviso prévio.

Sobre o autor

Agne é uma jornalista que cobre as últimas tendências e desenvolvimentos no metaverso, IA e Web3 indústrias para o Metaverse Post. Sua paixão por contar histórias a levou a realizar inúmeras entrevistas com especialistas nessas áreas, sempre buscando descobrir histórias emocionantes e envolventes. Agne é bacharel em literatura e possui ampla experiência em redação sobre uma ampla variedade de tópicos, incluindo viagens, arte e cultura. Ela também foi voluntária como editora da organização de direitos dos animais, onde ajudou a aumentar a conscientização sobre questões de bem-estar animal. Entre em contato com ela [email protegido].

Mais artigos
Agne Cimerman
Agne Cimerman

Agne é uma jornalista que cobre as últimas tendências e desenvolvimentos no metaverso, IA e Web3 indústrias para o Metaverse Post. Sua paixão por contar histórias a levou a realizar inúmeras entrevistas com especialistas nessas áreas, sempre buscando descobrir histórias emocionantes e envolventes. Agne é bacharel em literatura e possui ampla experiência em redação sobre uma ampla variedade de tópicos, incluindo viagens, arte e cultura. Ela também foi voluntária como editora da organização de direitos dos animais, onde ajudou a aumentar a conscientização sobre questões de bem-estar animal. Entre em contato com ela [email protegido].

Hot Stories
Junte-se ao nosso boletim informativo.
Últimas notícias

Chega o dia da sentença: o destino de CZ está em equilíbrio enquanto o tribunal dos EUA considera o apelo do DOJ

Changpeng Zhao está prestes a ser condenado hoje em um tribunal dos EUA em Seattle.

Saber Mais

Fundadores da Samourai Wallet acusados ​​de facilitar US$ 2 bilhões em negócios Darknet

A apreensão dos fundadores da Samourai Wallet representa um revés notável para a indústria, ressaltando a persistência ...

Saber Mais
Junte-se à nossa comunidade tecnológica inovadora
Saiba Mais
Saiba mais
Ankr colabora com a AI Blockchain Platform Talus Network para desbloquear a liquidez do Bitcoin para IA
O negócio Relatório de notícias Equipar
Ankr colabora com a AI Blockchain Platform Talus Network para desbloquear a liquidez do Bitcoin para IA
1 de maio de 2024
Binance Labs apoia Movement Labs para facilitar a integração de movimentos do Facebook entre blockchains
O negócio Relatório de notícias Equipar
Binance Labs apoia Movement Labs para facilitar a integração de movimentos do Facebook entre blockchains
1 de maio de 2024
Solução comercial de stablecoin do olho das nações do BRICS
O negócio Mercados Histórias e resenhas Equipar
Solução comercial de stablecoin do olho das nações do BRICS
1 de maio de 2024
Bitcoin L2 Network BOB integra-se ao LayerZero para funcionalidade aprimorada
O negócio Relatório de notícias Equipar
Bitcoin L2 Network BOB integra-se ao LayerZero para funcionalidade aprimorada
1 de maio de 2024
CRYPTOMERIA LABS PTE. LTDA.