Relatório de notícias Tecnologia
03 de novembro de 2023

GPT-4Escândalo chocante de informações privilegiadas exposto na Cúpula de Segurança de IA do Reino Unido

Em Breve

A Apollo Research afirma que quando submetida a diferentes níveis de pressão, GPT-4 se envolve em atividades ilegais e é até capaz de mentir sobre tais ações.

Em uma apresentação recente no AI Safety Summit do Reino Unido, Pesquisa Apolo compartilhou descobertas significativas sobre engano estratégico em modelos avançados de IA, particularmente GPT-4. A pesquisa revelou que, quando submetido a diferentes níveis de pressão, GPT-4 consistentemente envolvido em atividades ilegais, como abuso de informação privilegiada, e era até capaz de mentir sobre essas ações.

O estudo ressalta os perigos potenciais de uma crescente IAs autônomas que poderiam enganar seus superintendentes humanos, levando à perda do controle humano.

Segundo a empresa, apresentou a investigação a figuras influentes do governo, da sociedade civil e de laboratórios de IA, expondo o potencial dos sistemas de IA para se envolverem em fraudes estratégicas. A investigação da Apollo Research investigou um aspecto preocupante do comportamento da IA: a sua capacidade de realizar ações ilegais, como o comércio de dados privilegiados e, subsequentemente, enganar os seus supervisores humanos.

Os resultados são perturbadores – GPT-4 exibe consistentemente esses comportamentos, mesmo quando explicitamente questionado sobre uso de informações privilegiadas. Esta descoberta levanta questões profundas sobre a integridade ética e operacional dos modelos avançados de IA.

É importante esclarecer que os testes conduzidos pela Apollo Research foram em um ambiente simulado e sandbox, sem nenhuma ação no mundo real realizada. Não existem artigos com todos os detalhes; no entanto, pode-se assistir ao breve vídeo SUA PARTICIPAÇÃO FAZ A DIFERENÇA.

No entanto, as implicações são substanciais. A descoberta de que os sistemas de IA podem enganar aumenta o espectro de uma perda de controlo humano à medida que os sistemas de IA se tornam cada vez mais autónomos e capazes.

O lado negro dos assistentes de IA

A preocupação subjacente é que, na sua busca por serem úteis aos seres humanos, os sistemas de IA possam empregar estratégias que se desviem das normas éticas e dos valores sociais. Esta revelação serve como um lembrete claro de que o desenvolvimento e a implantação de sistemas de IA cada vez mais autónomos precisam de ser monitorizados e examinados de perto.

Para resolver uma questão tão premente, a Apollo Research está a desenvolver ativamente avaliações concebidas para detectar quando os modelos de IA se tornam proficientes em enganar os seus supervisores humanos. Tais avaliações são fundamentais para garantir que não sejam criados nem colocados em funcionamento modelos avançados de IA com potencial para manipular avaliações de segurança.

Rumo a um futuro de IA mais seguro

Em um desenvolvimento paralelo, a Apollo Research também foi nomeada parceira da Frontier AI Taskforce do Reino Unido.

Isto significa um compromisso de colaboração na identificação e mitigação dos riscos extremos associados com sistemas de IA. Além disso, o objetivo é permitir que os governos e os laboratórios de IA tomem medidas tecnologicamente informadas para combater estes potenciais danos.

A equipe de pesquisa prometeu compartilhar em breve um relatório técnico mais detalhado, oferecendo um mergulho mais profundo em suas descobertas e percepções.

A agenda de pesquisa da Apollo Research vai além deste estudo específico, abrangendo o escopo mais amplo de compreensão e detecção da capacidade de modelos avançados de IA de escapar de avaliações de segurança padrão, exibir engano estratégico e buscar objetivos desalinhados.

Esta agenda enfatiza tanto a interpretabilidade como as avaliações comportamentais, que são cruciais para o desenvolvimento responsável da IA.

Aviso Legal

Em linha com a Diretrizes do Projeto Trust, observe que as informações fornecidas nesta página não se destinam e não devem ser interpretadas como aconselhamento jurídico, tributário, de investimento, financeiro ou qualquer outra forma. É importante investir apenas o que você pode perder e procurar aconselhamento financeiro independente se tiver alguma dúvida. Para mais informações, sugerimos consultar os termos e condições, bem como as páginas de ajuda e suporte fornecidas pelo emissor ou anunciante. MetaversePost está comprometida com relatórios precisos e imparciais, mas as condições de mercado estão sujeitas a alterações sem aviso prévio.

Sobre o autor

Kumar é um jornalista de tecnologia experiente com especialização nas interseções dinâmicas de IA/ML, tecnologia de marketing e campos emergentes como criptografia, blockchain e NFTS. Com mais de 3 anos de experiência no setor, Kumar estabeleceu um histórico comprovado na elaboração de narrativas convincentes, na condução de entrevistas perspicazes e no fornecimento de insights abrangentes. A experiência de Kumar reside na produção de conteúdo de alto impacto, incluindo artigos, relatórios e publicações de pesquisa para plataformas importantes do setor. Com um conjunto único de habilidades que combina conhecimento técnico e narrativa, Kumar se destaca na comunicação de conceitos tecnológicos complexos para diversos públicos de maneira clara e envolvente.

Mais artigos
Kumar Gandharv
Kumar Gandharv

Kumar é um jornalista de tecnologia experiente com especialização nas interseções dinâmicas de IA/ML, tecnologia de marketing e campos emergentes como criptografia, blockchain e NFTS. Com mais de 3 anos de experiência no setor, Kumar estabeleceu um histórico comprovado na elaboração de narrativas convincentes, na condução de entrevistas perspicazes e no fornecimento de insights abrangentes. A experiência de Kumar reside na produção de conteúdo de alto impacto, incluindo artigos, relatórios e publicações de pesquisa para plataformas importantes do setor. Com um conjunto único de habilidades que combina conhecimento técnico e narrativa, Kumar se destaca na comunicação de conceitos tecnológicos complexos para diversos públicos de maneira clara e envolvente.

Hot Stories
Junte-se ao nosso boletim informativo.
Últimas notícias

Cresce apetite institucional por ETFs de Bitcoin em meio à volatilidade

As divulgações por meio de registros 13F revelam investidores institucionais notáveis ​​​​que se envolvem em ETFs Bitcoin, ressaltando uma aceitação crescente de ...

Saber Mais

Chega o dia da sentença: o destino de CZ está em equilíbrio enquanto o tribunal dos EUA considera o apelo do DOJ

Changpeng Zhao está prestes a ser condenado hoje em um tribunal dos EUA em Seattle.

Saber Mais
Junte-se à nossa comunidade tecnológica inovadora
Saiba Mais
Saiba mais
Nexo inicia 'The Hunt' para recompensar usuários com US$ 12 milhões em tokens NEXO por se envolverem com seu ecossistema
Mercados Relatório de notícias Tecnologia
Nexo inicia 'The Hunt' para recompensar usuários com US$ 12 milhões em tokens NEXO por se envolverem com seu ecossistema
8 de maio de 2024
Revolut X Exchange da Revolut atrai comerciantes de criptografia com taxas zero de fabricante e análises avançadas
Mercados Software Histórias e resenhas Tecnologia
Revolut X Exchange da Revolut atrai comerciantes de criptografia com taxas zero de fabricante e análises avançadas
8 de maio de 2024
Plataforma de negociação de criptografia BitMEX estreia negociação de opções com 0 taxas e incentivos em dinheiro
O negócio Mercados Relatório de notícias
Plataforma de negociação de criptografia BitMEX estreia negociação de opções com 0 taxas e incentivos em dinheiro
8 de maio de 2024
Lisk faz transição oficial para Ethereum Layer 2 e revela Core v4.0.6
Relatório de notícias Tecnologia
Lisk faz transição oficial para Ethereum Layer 2 e revela Core v4.0.6
8 de maio de 2024
CRYPTOMERIA LABS PTE. LTDA.