O Google anunciou o primeiro Promptbreeder de modelo de IA com autoaperfeiçoamento que evolui bilhões de vezes mais rápido que os humanos
Os desenvolvedores DeepMind do Google introduziram “Promptbreeder (PB): autoaperfeiçoamento autorreferencial por meio da evolução acelerada.” Este desenvolvimento pioneiro promete uma nova abordagem para aprimorar as capacidades de grandes modelos de linguagem (LLMs), aproveitando o poder da evolução acelerada.
No centro desta inovação está a constatação de que a inteligência de um grande modelo linguístico está intimamente ligada à qualidade das pistas textuais que recebe. Em essência, quanto mais inteligentes as dicas, mais inteligentes e precisas se tornam as respostas do modelo. Conseqüentemente, a tarefa crítica em questão é elaborar estratégias de dicas ideais para orientar esses modelos de forma eficaz.
Estratégias convencionais de estímulo, como a cadeia de pensamento ou abordagens de planejamento e decisão, melhoraram inegavelmente as habilidades de raciocínio dos LLMs. No entanto, estas estratégias, muitas vezes concebidas manualmente, podem ficar aquém do desempenho ideal.
Promptbreeder é uma solução que usa um mecanismo evolutivo para refinar iterativamente estratégias de dicas. O que distingue o PB é a sua notável capacidade de melhorar não apenas as dicas, mas também as suas próprias capacidades de melhoria de dicas a cada nova geração.
Veja como funciona o esquema evolutivo do Promptbreeder:
- Sob a orientação de um LLM, o Promptbreeder gera uma população de unidades de evolução, cada uma compreendendo duas “dicas de solução” e uma “dica de mutação”.
- Um algoritmo genético de torneio binário é então empregado para avaliar a aptidão desses mutantes com base em um conjunto de treinamento, identificando aqueles que apresentam melhor desempenho.
- Este processo cíclico reverte continuamente para a etapa 1, resultando em última análise na evolução de gerações de “dicas-soluções”.
Ao longo de várias gerações, o Promptbreeder empregou cinco classes diferentes de operadores de mutação para transformar tanto “dicas de solução” quanto “dicas de mutação”. O brilho deste esquema reside no facto de estas “dicas-soluções” mutantes se tornarem progressivamente mais inteligentes. As “dicas de mutação” são fundamentais aqui, fornecendo instruções sobre como sofrer mutação para aprimorar as “dicas de solução”.
Promptbreeder, em essência, é um sistema auto-referencial e de autoaperfeiçoamento que opera dentro do domínio da linguagem natural. Crucialmente, não requer nenhum ajuste fino intrincado da rede neural. Em vez disso, produz dicas personalizadas, meticulosamente otimizadas para aplicações específicas.
Os experimentos iniciais produziram resultados promissores. O Promptbreeder superou todos os outros métodos contemporâneos de dicas em tarefas matemáticas, lógicas, de bom senso e classificação de linguagem, incluindo a identificação de discurso de ódio.
Olhando para o futuro, o Promptbreeder está passando por testes rigorosos quanto à sua viabilidade na construção de um processo de pensamento completo. Isto envolve explorar uma estratégia de N-dicas, onde as dicas são aplicadas condicionalmente, abrindo caminho para o desenvolvimento de pré-programas para políticas LLM envolvidas em diálogos socráticos adversários.
O Promptbreeder ainda apresenta limitações quando comparado à natureza expansiva dos processos de pensamento humano. A topologia da dica permanece fixa e o Promptbreeder adapta principalmente o conteúdo da dica, não o algoritmo da dica em si. O pensamento humano abrange aspectos multifacetados além da linguagem, incluindo entonação, imagens e um sistema multimodal, que o Promptbreeder ainda não possui.
Leia mais tópicos relacionados:
Aviso Legal
Em linha com a Diretrizes do Projeto Trust, observe que as informações fornecidas nesta página não se destinam e não devem ser interpretadas como aconselhamento jurídico, tributário, de investimento, financeiro ou qualquer outra forma. É importante investir apenas o que você pode perder e procurar aconselhamento financeiro independente se tiver alguma dúvida. Para mais informações, sugerimos consultar os termos e condições, bem como as páginas de ajuda e suporte fornecidas pelo emissor ou anunciante. MetaversePost está comprometida com relatórios precisos e imparciais, mas as condições de mercado estão sujeitas a alterações sem aviso prévio.
Sobre o autor
Damir é o líder de equipe, gerente de produto e editor da Metaverse Post, abordando tópicos como AI/ML, AGI, LLMs, Metaverse e Web3-Campos relacionados. Seus artigos atraem um grande público de mais de um milhão de usuários todos os meses. Ele parece ser um especialista com 10 anos de experiência em SEO e marketing digital. Damir foi mencionado em Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e outras publicações. Ele viaja entre os Emirados Árabes Unidos, Turquia, Rússia e CEI como um nômade digital. Damir formou-se em física, o que ele acredita ter lhe dado as habilidades de pensamento crítico necessárias para ter sucesso no cenário em constante mudança da internet.
Mais artigosDamir é o líder de equipe, gerente de produto e editor da Metaverse Post, abordando tópicos como AI/ML, AGI, LLMs, Metaverse e Web3-Campos relacionados. Seus artigos atraem um grande público de mais de um milhão de usuários todos os meses. Ele parece ser um especialista com 10 anos de experiência em SEO e marketing digital. Damir foi mencionado em Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e outras publicações. Ele viaja entre os Emirados Árabes Unidos, Turquia, Rússia e CEI como um nômade digital. Damir formou-se em física, o que ele acredita ter lhe dado as habilidades de pensamento crítico necessárias para ter sucesso no cenário em constante mudança da internet.