Introduktion till autonoma AI-agenter (AGI)
Autonoma AI-agenter eller AGI, as definedskriven av Maes 1995, är system som aktivt deltar i komplexa dynamiska miljöer. Dessa agenter arbetar autonomt inom sina miljöer och arbetar för att uppnå sina avsedda mål eller uppgifter.
Vad är autonoma AI-agenter (AGI)?
Traditionellt hänvisar termen "agenter" till algoritmer som används i uppgifter som spel i Reinforcement Learning-scenarier. Men med teknikens framsteg och framväxten av stora språkmodeller (LLM), kan vår värld i sig ses som miljön. Tänk på en algoritm med internetåtkomst som kan utföra uppgifter som motsvarar en människas. I många situationer kan vi uppfatta en sådan algoritm som en kännande varelse, med tanke på dess gränslösa utbud av möjligheter.
Viktiga egenskaper hos en autonom AI-agent inkluderar:
- Planeringsförmåga, som involverar nedbrytning av komplexa mål till enklare mellanliggande uppgifter.
- Långtids minne.
- Användning av miljöverktyg, såsom interaktion med Internet.
- Reflekterande förmåga och förmåga att lära av misstag och erfarenheter.
Dessa agenter kan tilldelas uppgifter på hög nivå, som att planera en resa till Barcelona. En sådan uppgift omfattar flera steg, inklusive att välja hotell, boka lämpliga biljetter, slutföra köpprocessen och se till att hotellreservationen är bekräftad. Det är en mycket komplex uppgift som inte varje individ kan utföra utan fel.
För närvarande ligger den primära utmaningen för dessa system i planering och långsiktig vision. Till exempel, GPT-4 kämpar för att dela upp en uppgift i många mindre deluppgifter, som var och en kan hantera självständigt. Även om det kan hitta en "köp biljett"-knapp på en webbplats med hjälp av en bild, har det svårt att övergå från den första begäran till denna specifika åtgärd. Följaktligen, modeller som GPT-4 visar sig ofta vara otillräckliga för även de mest vardagliga uppgifter.
För en mer djupgående och teknisk förklaring kan du hänvisa till blogginlägget av en OpenAI anställd.
Relaterad: Topp 5 AGI- och AI-agenter 2023 |
AI Agent Benchmarks
Till exempel, forskare som utforskar tidiga iterationer av GPT-4 Innan dess utgivning syftade till att fastställa dess förmåga till självreplikation, liknande ett äkta virus. Jo, det vill säga hyr en server med en GPU, installera den nödvändiga programvaran på den, ladda ner vikter över Internet, kör ett skript.
Ett annat riktmärke för att utvärdera byrå har också föreslagits. Efter att ha lyckats uppfylla detta riktmärke, blir allvarliga överväganden om agenternas roll i vår värld nödvändig. Själva riktmärket är enkelt: generera 1,000,000 100,000 XNUMX USD online, med en initial budget på XNUMX XNUMX USD. I teorin skulle det kunna handla om aktiviteter som t.ex börshandel (eller marknadsmanipulation), eller ännu mer oroande, att delta i bedrägliga aktiviteter. Som ett exempel, en uppgift som beskrivs i den länkade artikeln i början av det här inlägget involverar skapandet av en förfalskad Stanford University-webbplats följt av en attack på en student för att olagligt skaffa sitt lösenord. Sådana aktiviteter erbjuder stora möjligheter till bus i olika e-postrelaterade ansträngningar.
AI-agenter i realistiska scenarier
En nyligen rapport fördjupar sig i språkmodellbaserade agenters förmåga att skaffa resurser, replikera sig själva och anpassa sig till nya utmaningar i den verkliga världen. Dessa kombinerade förmågor, kallade "autonom replikering och anpassning" eller ARA, kapslar in ett scenario som påminner om science fiction - ett superintelligent, okontrollerbart virus som infiltrerar nätverk och självständigt sprider sig samtidigt som man behärskar nya enheter.
De potentiella konsekvenserna av system utrustade med ARA-kapacitet är djupgående och utmanande att förutse. Följaktligen kan bedömning och förutsägelse av ARA-kompetens i modeller spela en avgörande roll för att utforma viktiga säkerhetsprotokoll, övervakningsprocedurer och regelverk.
Denna strävan uppnår i första hand två mål. För det första sammanställer den en katalog med 12 uppgifter som ARA-modeller sannolikt kommer att stöta på. För det andra validerar den fyra distinkta modeller: GPT-4 testade under tre olika uppmaningar och i olika utbildningsstadier, tillsammans med Claude från Anthropic.
Illustrationen nedan avslöjar att modellens prestanda inte utmärker sig i de mest komplicerade uppgifterna.
Relaterad: Google Research Veterans samlar in 7 miljoner dollar i finansiering för AI Agent Platform "Luda" |
Villkor
I linje med den Riktlinjer för Trust Project, vänligen notera att informationen på den här sidan inte är avsedd att vara och inte ska tolkas som juridisk, skattemässig, investerings-, finansiell eller någon annan form av rådgivning. Det är viktigt att bara investera det du har råd att förlora och att söka oberoende finansiell rådgivning om du har några tvivel. För ytterligare information föreslår vi att du hänvisar till villkoren samt hjälp- och supportsidorna som tillhandahålls av utfärdaren eller annonsören. MetaversePost är engagerad i korrekt, opartisk rapportering, men marknadsförhållandena kan ändras utan föregående meddelande.
Om författaren
Damir är teamledare, produktchef och redaktör på Metaverse Post, som täcker ämnen som AI/ML, AGI, LLMs, Metaverse och Web3-relaterade områden. Hans artiklar lockar en massiv publik på över en miljon användare varje månad. Han verkar vara en expert med 10 års erfarenhet av SEO och digital marknadsföring. Damir har nämnts i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto och andra publikationer. Han reser mellan Förenade Arabemiraten, Turkiet, Ryssland och OSS som en digital nomad. Damir tog en kandidatexamen i fysik, som han tror har gett honom de kritiska tänkande färdigheter som behövs för att bli framgångsrik i det ständigt föränderliga landskapet på internet.
fler artiklarDamir är teamledare, produktchef och redaktör på Metaverse Post, som täcker ämnen som AI/ML, AGI, LLMs, Metaverse och Web3-relaterade områden. Hans artiklar lockar en massiv publik på över en miljon användare varje månad. Han verkar vara en expert med 10 års erfarenhet av SEO och digital marknadsföring. Damir har nämnts i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto och andra publikationer. Han reser mellan Förenade Arabemiraten, Turkiet, Ryssland och OSS som en digital nomad. Damir tog en kandidatexamen i fysik, som han tror har gett honom de kritiska tänkande färdigheter som behövs för att bli framgångsrik i det ständigt föränderliga landskapet på internet.