Relatório de notícias Equipar
29 de março de 2023

GPT-4 Tem desempenho melhor do que a média das pessoas em um teste de raciocínio lógico, afirma estudo

Em Breve

Ilya Pestov, um pesquisador russo de IA, criou o teste de raciocínio lógico, que foi aprovado por 12 mil pessoas.

Recentemente, ele obteve acesso ao sistema mais inteligente GPT-4e conduziu um experimento para ver se a consulta correta poderia produzir alguns resultados.

Os resultados mostraram que a GPT-4 superou a pessoa média em raciocínio lógico.

Ilya Pestov, um conhecido pesquisador russo de IA, postou uma mensagem em seu Canal Telegram sobre o quão bem a rede neural lida com testes lógicos. Ilya uma vez criou o @psylogicbot teste de raciocínio lógico, que foi feito por aproximadamente 12 mil pessoas. Você pode verificar as estatísticas depois de fazer o teste.

@Midjourney /Abdalla(hamoXX)#7378
Leia mais: 20+ Melhores Chatbots de IA do Telegram de 2023

Ele escreveu isso ChatGPT também fiz testes, mas os resultados deixaram muito a desejar. Recentemente, ele teve acesso à versão mais inteligente e atualizada do GPT modelo-GPT-4– e decidiu verificar se obteria resultados semelhantes.

O experimento foi conduzido da seguinte forma: o pesquisador criou um texto que descrevia a tarefa que a rede neural deveria realizar. A pesquisadora postou tudo nos comentários: O prompt foi: “Vou lhe dar um quebra-cabeça lógico e quatro respostas possíveis; escolha a única resposta correta entre eles.” Então, para cada pergunta do teste, Ilya criou uma nova caixa de diálogo e enviou o GPT-4 descrição juntamente com o texto da pergunta. O bot recebeu a resposta sem nenhuma correção ou dica.

São 25 questões no total, sendo atribuído um ponto para cada resposta correta. Segundo as estatísticas, os usuários marcam em média 13.6 pontos, com mediana não superior a 14. Quanto fez GPT-4 pegar? Conseguiu 16 pontos!

Mais uma vez, a rede neural supera a pessoa média em raciocínio lógico. Ou seja, supera a maioria das pessoas testadas. E isso depois de levar em conta:

  • O teste foi realizado em russo, enquanto o modelo é ajustado para inglês;
  • GPT-4, usado no chat, é menos inteligente que seu antecessor (um efeito colateral das restrições éticas).

Separadamente, postaremos uma excelente resposta para a questão 22, na qual o neurônio utilizou a lógica de primeira ordem para derivar o resultado matematicamente. Embora isso tenha sido abordado em matemática aplicada, não é um curso universitário que todos fazem.

Separadamente, postaremos uma excelente resposta para a questão 22 em que o neurônio usou a lógica de primeira ordem para derivar o resultado matematicamente. Todos sabíamos fazer isso também em matemática aplicada, mas era um curso adicional na universidade.

ainda acredita nisso redes neurais são uma moda passageira? Primeiro, tente superar GPT-4 (e compartilhe seus resultados nos comentários).

Leia mais sobre IA:

Aviso Legal

Em linha com a Diretrizes do Projeto Trust, observe que as informações fornecidas nesta página não se destinam e não devem ser interpretadas como aconselhamento jurídico, tributário, de investimento, financeiro ou qualquer outra forma. É importante investir apenas o que você pode perder e procurar aconselhamento financeiro independente se tiver alguma dúvida. Para mais informações, sugerimos consultar os termos e condições, bem como as páginas de ajuda e suporte fornecidas pelo emissor ou anunciante. MetaversePost está comprometida com relatórios precisos e imparciais, mas as condições de mercado estão sujeitas a alterações sem aviso prévio.

Sobre o autor

Damir é o líder de equipe, gerente de produto e editor da Metaverse Post, abordando tópicos como AI/ML, AGI, LLMs, Metaverse e Web3-Campos relacionados. Seus artigos atraem um grande público de mais de um milhão de usuários todos os meses. Ele parece ser um especialista com 10 anos de experiência em SEO e marketing digital. Damir foi mencionado em Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e outras publicações. Ele viaja entre os Emirados Árabes Unidos, Turquia, Rússia e CEI como um nômade digital. Damir formou-se em física, o que ele acredita ter lhe dado as habilidades de pensamento crítico necessárias para ter sucesso no cenário em constante mudança da internet. 

Mais artigos
Damir Yalalov
Damir Yalalov

Damir é o líder de equipe, gerente de produto e editor da Metaverse Post, abordando tópicos como AI/ML, AGI, LLMs, Metaverse e Web3-Campos relacionados. Seus artigos atraem um grande público de mais de um milhão de usuários todos os meses. Ele parece ser um especialista com 10 anos de experiência em SEO e marketing digital. Damir foi mencionado em Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e outras publicações. Ele viaja entre os Emirados Árabes Unidos, Turquia, Rússia e CEI como um nômade digital. Damir formou-se em física, o que ele acredita ter lhe dado as habilidades de pensamento crítico necessárias para ter sucesso no cenário em constante mudança da internet. 

Hot Stories
Junte-se ao nosso boletim informativo.
Últimas notícias

O frenesi DOGE: analisando o recente aumento de valor do Dogecoin (DOGE)

A indústria de criptomoedas está se expandindo rapidamente e as moedas meme estão se preparando para um aumento significativo. Dogecoin (DOGE), ...

Saber Mais

A evolução do conteúdo gerado por IA no metaverso

O surgimento de conteúdo generativo de IA é um dos desenvolvimentos mais fascinantes dentro do ambiente virtual...

Saber Mais
Junte-se à nossa comunidade tecnológica inovadora
Saiba Mais
Saiba mais
As principais ofertas desta semana, grandes investimentos em IA, TI, Web3e criptografia (22-26.04)
Digerir O negócio Mercados Equipar
As principais ofertas desta semana, grandes investimentos em IA, TI, Web3e criptografia (22-26.04)
26 de abril de 2024
Vitalik Buterin comenta sobre centralização do PoW, observa que era um estágio temporário até o PoS
Relatório de notícias Equipar
Vitalik Buterin comenta sobre centralização do PoW, observa que era um estágio temporário até o PoS
26 de abril de 2024
Offchain Labs revela descoberta de duas vulnerabilidades críticas nas provas de fraude do OP Stack do Optimism
Relatório de notícias Software Equipar
Offchain Labs revela descoberta de duas vulnerabilidades críticas nas provas de fraude do OP Stack do Optimism
26 de abril de 2024
Mercado aberto da Dymension para aumentar a liquidez da RollApps eIBC é lançado na rede principal
Relatório de notícias Equipar
Mercado aberto da Dymension para aumentar a liquidez da RollApps eIBC é lançado na rede principal 
26 de abril de 2024
CRYPTOMERIA LABS PTE. LTDA.