Relatório de notícias SMW Equipar
30 de maio de 2023

GPT-4O desempenho da Ordem dos Advogados dos EUA contradiz suas afirmações

Em Breve

O exame de GPT-4o desempenho de no Uniform Bar Exam revelou uma discrepância entre o desempenho estimado e o real, enfatizando a importância de procedimentos de avaliação transparentes e dados acessíveis.

OpenAI é incentivado a abordar as discrepâncias e desenvolver uma abordagem mais inclusiva e confiável para a avaliação do modelo de IA para ganhar confiança e garantir a credibilidade.

Em um exame recente GPT-4desempenho no Exame da Ordem Uniforme (UBE), surgiram dúvidas sobre a precisão OpenAIsobre a taxa de sucesso do modelo. Ao contrário da afirmação inicial de que GPT-4 supera 90% dos indivíduos, as descobertas sugerem uma discrepância significativa entre o desempenho estimado e o real do modelo de IA. Esta revelação enfatiza a importância de procedimentos de avaliação transparentes e dados acessíveis para validar tais reivindicações.

GPT-4O desempenho da Ordem dos Advogados dos EUA contradiz suas afirmações
@Midjourney

O exame se concentrou em vários fatores para determinar as verdadeiras capacidades do GPT-4. Em primeiro lugar, o análise dos exames de fevereiro em Illinois revelaram que GPT-4as pontuações se aproximaram do Percentil 90. No entanto, observou-se que essas pontuações foram fortemente influenciadas pelos repetentes que haviam reprovado anteriormente no exame de julho e, portanto, pontuaram abaixo da média geral.

Além disso, os resultados do exame de julho contradiziam OpenAIreivindicações, revelando que GPT-4 só Superar 68% das pessoas e 48% das redações. GPT-4o desempenho de contra candidatos pela primeira vez (excluindo repetições) foi avaliado no percentil 63 quando foram considerados dados oficiais de vários testes em períodos diferentes, com redações com pontuação consideravelmente mais baixa no percentil 41.

Uma perspectiva adicional foi obtida ao examinar o desempenho daqueles que passaram no exame, incluindo indivíduos licenciados e aqueles que aguardam licenciamento. A respeito disso, GPT-4o desempenho geral de foi classificado no 48º percentil, com as redações se saindo ainda pior no 15º percentil.

Embora estas descobertas sejam preocupantes, é fundamental considerar a possibilidade de erro humano no processo de revisão. O autor do artigo enfatiza a importância de compreender a amostra utilizada pelos pesquisadores para avaliar GPT-4desempenho. A falta de dados oficiais, especialmente de forma agregada, dificulta a comparação e avaliação justas dos percentis. É fundamental estabelecer técnicas de avaliação claras e acessíveis que possam ser avaliadas por todas as partes interessadas.

Em resposta a essas preocupações, OpenAI é instado a abordar as discrepâncias e fornecer mais informações no processo de avaliação. Transparência e abertura são essenciais para ganhar confiança e garantir a credibilidade dos modelos de IA em domínios de alto risco, como o direito.

Ressalta-se que o artigo não discute a pontuação específica alcançada por GPT-4, que é relatado como sendo 298. Avaliar a importância desta pontuação requer uma compreensão contextual do sistema de classificação utilizado. Assim como uma criança que volta da escola com nota B pode ser motivo de comemoração ou decepção, a interpretação do GPT-4a pontuação depende da escala empregada.

A avaliação de GPT-4desempenho no exame da ordem levanta sérias preocupações sobre a veracidade de OpenAIas afirmações iniciais. A lacuna entre o desempenho estimado e o real enfatiza a importância de sistemas de avaliação claros e dados facilmente acessíveis. OpenAI é incentivado a enfrentar esses desafios e desenvolver uma visão mais inclusiva e abordagem confiável para IA avaliação do modelo.

Leia mais sobre IA:

Aviso Legal

Em linha com a Diretrizes do Projeto Trust, observe que as informações fornecidas nesta página não se destinam e não devem ser interpretadas como aconselhamento jurídico, tributário, de investimento, financeiro ou qualquer outra forma. É importante investir apenas o que você pode perder e procurar aconselhamento financeiro independente se tiver alguma dúvida. Para mais informações, sugerimos consultar os termos e condições, bem como as páginas de ajuda e suporte fornecidas pelo emissor ou anunciante. MetaversePost está comprometida com relatórios precisos e imparciais, mas as condições de mercado estão sujeitas a alterações sem aviso prévio.

Sobre o autor

Damir é o líder de equipe, gerente de produto e editor da Metaverse Post, abordando tópicos como AI/ML, AGI, LLMs, Metaverse e Web3-Campos relacionados. Seus artigos atraem um grande público de mais de um milhão de usuários todos os meses. Ele parece ser um especialista com 10 anos de experiência em SEO e marketing digital. Damir foi mencionado em Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e outras publicações. Ele viaja entre os Emirados Árabes Unidos, Turquia, Rússia e CEI como um nômade digital. Damir formou-se em física, o que ele acredita ter lhe dado as habilidades de pensamento crítico necessárias para ter sucesso no cenário em constante mudança da internet. 

Mais artigos
Damir Yalalov
Damir Yalalov

Damir é o líder de equipe, gerente de produto e editor da Metaverse Post, abordando tópicos como AI/ML, AGI, LLMs, Metaverse e Web3-Campos relacionados. Seus artigos atraem um grande público de mais de um milhão de usuários todos os meses. Ele parece ser um especialista com 10 anos de experiência em SEO e marketing digital. Damir foi mencionado em Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e outras publicações. Ele viaja entre os Emirados Árabes Unidos, Turquia, Rússia e CEI como um nômade digital. Damir formou-se em física, o que ele acredita ter lhe dado as habilidades de pensamento crítico necessárias para ter sucesso no cenário em constante mudança da internet. 

Hot Stories
Junte-se ao nosso boletim informativo.
Últimas notícias

Chega o dia da sentença: o destino de CZ está em equilíbrio enquanto o tribunal dos EUA considera o apelo do DOJ

Changpeng Zhao está prestes a ser condenado hoje em um tribunal dos EUA em Seattle.

Saber Mais

Fundadores da Samourai Wallet acusados ​​de facilitar US$ 2 bilhões em negócios Darknet

A apreensão dos fundadores da Samourai Wallet representa um revés notável para a indústria, ressaltando a persistência ...

Saber Mais
Junte-se à nossa comunidade tecnológica inovadora
Saiba Mais
Saiba mais
Chainlink e Rapid Addition colaboram para desenvolver adaptador Blockchain baseado em CCIP
O negócio Relatório de notícias Equipar
Chainlink e Rapid Addition colaboram para desenvolver adaptador Blockchain baseado em CCIP
1 de maio de 2024
BitSmiley lança Alphanet V1, estreia na rede Bitcoin Layer 2 Bitlayer
Relatório de notícias Equipar
BitSmiley lança Alphanet V1, estreia na rede Bitcoin Layer 2 Bitlayer
1 de maio de 2024
Abril de 2024 registra mínimo histórico em hacks e golpes, CertiK relata queda de 141% em relação a março
Mercados Segurança Wiki Histórias e resenhas Equipar
Abril de 2024 registra mínimo histórico em hacks e golpes, CertiK relata queda de 141% em relação a março
1 de maio de 2024
O preço do Bitcoin cai antes do anúncio da decisão da taxa de juros do Federal Reserve, analistas alertam sobre uma potencial mudança de mercado
Mercados Relatório de notícias Equipar
O preço do Bitcoin cai antes do anúncio da decisão da taxa de juros do Federal Reserve, analistas alertam sobre uma potencial mudança de mercado
1 de maio de 2024
CRYPTOMERIA LABS PTE. LTDA.