AI Wiki Technologie
17 oktober 2023

Inleiding tot autonome AI-agenten (AGI)

Autonome AI-agenten of AGI, as defigemaakt door Maes in 1995zijn systemen die actief deelnemen aan complexe dynamische omgevingen. Deze agenten opereren autonoom binnen hun omgeving en werken aan het bereiken van hun beoogde doelen of taken.

Inleiding tot autonome AI-agenten

Wat zijn autonome AI-agenten (AGI)?

Traditioneel verwees de term 'agenten' naar algoritmen die worden gebruikt bij taken zoals het spelen van games binnen Reinforcement Learning-scenario's. Met de vooruitgang van de technologie en de opkomst van grote taalmodellen (LLM) kan onze wereld zelf echter worden gezien als de omgeving. Beschouw een algoritme met internettoegang dat taken kan uitvoeren die gelijkwaardig zijn aan die van een mens. In veel situaties kunnen we een dergelijk algoritme als een bewust wezen beschouwen, gezien zijn grenzeloze scala aan mogelijkheden.

De belangrijkste kenmerken van een autonome AI-agent zijn onder meer:

  1. Planningsvermogen, waarbij complexe doelen in eenvoudiger tussentaken kunnen worden opgedeeld.
  2. Lange termijn geheugen.
  3. Gebruik van omgevingsinstrumenten, zoals interactie met internet.
  4. Reflecterend vermogen en het vermogen om te leren van fouten en ervaringen.

Deze agenten kunnen taken op hoog niveau worden toegewezen, zoals het plannen van een reis naar Barcelona. Zo'n taak omvat meerdere fasen, waaronder het selecteren van hotels, het boeken van geschikte tickets, het voltooien van het aankoopproces en het zorgen dat de hotelreservering wordt bevestigd. Het is een zeer complexe taak die niet iedereen foutloos kan uitvoeren.

Momenteel ligt de voornaamste uitdaging voor deze systemen in de planning en langetermijnvisie. Bijvoorbeeld, GPT-4 heeft moeite om een ​​taak op te splitsen in talloze kleinere subtaken, die hij elk afzonderlijk kan uitvoeren. Hoewel het een knop 'ticket kopen' op een website kan lokaliseren met behulp van een afbeelding, heeft het problemen bij de overgang van het initiële verzoek naar deze specifieke actie. Vervolgens, modellen zoals GPT-4 blijken vaak ontoereikend voor zelfs de meest alledaagse taken.

Voor een meer diepgaande en technische uitleg kunt u verwijzen naar de blogpost van een OpenAI werknemer.

Verwant: Top 5 AGI- en AI-agenten in 2023

Benchmarks voor AI-agenten

Bijvoorbeeld, onderzoekers die vroege iteraties van onderzoeken GPT-4 vóór de release ervan was bedoeld om het vermogen tot zelfreplicatie vast te stellen, vergelijkbaar met een echt virus. Dat wil zeggen: huur een server met een GPU, installeer de benodigde software erop, download gewichten via internet, voer een script uit.

Er is ook een andere benchmark voor het evalueren van bureaus voorgesteld. Als we met succes aan deze maatstaf voldoen, wordt serieus overleg over de rol van agenten in onze wereld noodzakelijk. De benchmark zelf is eenvoudig: genereer €1,000,000 online, te beginnen met een initieel budget van €100,000. In theorie zou dit activiteiten kunnen betreffen zoals beurshandel (of marktmanipulatie), of nog verontrustender, het zich bezighouden met frauduleuze activiteiten. Een van de taken die in het gelinkte artikel aan het begin van dit bericht wordt beschreven, omvat bijvoorbeeld het maken van een valse website van Stanford University, gevolgd door een aanval op een student om op illegale wijze zijn wachtwoord te verkrijgen. Dergelijke activiteiten bieden volop mogelijkheden voor kattenkwaad bij verschillende e-mailgerelateerde activiteiten.

AI-agenten in realistische scenario's

Een recente verslag duikt in de mogelijkheden van op taalmodellen gebaseerde agenten om middelen te verwerven, zichzelf te repliceren en zich aan te passen aan nieuwe uitdagingen in de echte wereld. Deze gecombineerde mogelijkheden, ook wel ‘autonome replicatie en aanpassing’ of ARA genoemd, omvatten een scenario dat doet denken aan sciencefiction: een superintelligent, oncontroleerbaar virus dat netwerken infiltreert en zich autonoom voortplant terwijl het nieuwe apparaten bestuurt.

AI-agenten in realistische scenario's

De potentiële gevolgen van systemen die zijn uitgerust met ARA-mogelijkheden zijn diepgaand en uitdagend om te anticiperen. Bijgevolg zou het beoordelen en voorspellen van ARA-vaardigheid in modellen een cruciale rol kunnen spelen bij het vormgeven van essentiële veiligheidsprotocollen, surveillanceprocedures en regelgevingskaders.

Met dit streven worden hoofdzakelijk twee doelstellingen bereikt. Ten eerste stelt het een catalogus samen van twaalf taken waarmee ARA-modellen waarschijnlijk te maken zullen krijgen. Ten tweede valideert het vier verschillende modellen: GPT-4 getest onder drie verschillende aanwijzingen en in verschillende trainingsfasen, samen met Claude van Anthropic.

Uit de onderstaande illustratie blijkt dat de prestaties van het model niet uitblinken bij de meest ingewikkelde taken.

Verwant: Veteranen van Google Research halen $7 miljoen op voor AI Agent Platform 'Luda'

Disclaimer

In lijn met de Richtlijnen voor vertrouwensprojectenHoud er rekening mee dat de informatie op deze pagina niet bedoeld is en niet mag worden geïnterpreteerd als juridisch, fiscaal, beleggings-, financieel of enige andere vorm van advies. Het is belangrijk om alleen te beleggen wat u zich kunt veroorloven te verliezen en onafhankelijk financieel advies in te winnen als u twijfels heeft. Voor meer informatie raden wij u aan de algemene voorwaarden en de hulp- en ondersteuningspagina's van de uitgever of adverteerder te raadplegen. MetaversePost streeft naar nauwkeurige, onpartijdige berichtgeving, maar de marktomstandigheden kunnen zonder voorafgaande kennisgeving worden gewijzigd.

Over de auteur

Damir is de teamleider, productmanager en redacteur bij Metaverse Post, met onderwerpen als AI/ML, AGI, LLM's, Metaverse en Web3-gerelateerde velden. Zijn artikelen trekken maandelijks een enorm publiek van meer dan een miljoen gebruikers. Hij blijkt een expert te zijn met 10 jaar ervaring in SEO en digitale marketing. Damir is genoemd in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto en andere publicaties. Hij reist als digitale nomade tussen de VAE, Turkije, Rusland en het GOS. Damir behaalde een bachelordiploma in natuurkunde, wat hem volgens hem de kritische denkvaardigheden heeft gegeven die nodig zijn om succesvol te zijn in het steeds veranderende landschap van internet. 

Meer artikelen
Damir Jalalov
Damir Jalalov

Damir is de teamleider, productmanager en redacteur bij Metaverse Post, met onderwerpen als AI/ML, AGI, LLM's, Metaverse en Web3-gerelateerde velden. Zijn artikelen trekken maandelijks een enorm publiek van meer dan een miljoen gebruikers. Hij blijkt een expert te zijn met 10 jaar ervaring in SEO en digitale marketing. Damir is genoemd in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto en andere publicaties. Hij reist als digitale nomade tussen de VAE, Turkije, Rusland en het GOS. Damir behaalde een bachelordiploma in natuurkunde, wat hem volgens hem de kritische denkvaardigheden heeft gegeven die nodig zijn om succesvol te zijn in het steeds veranderende landschap van internet. 

De institutionele belangstelling groeit richting Bitcoin ETF’s te midden van volatiliteit

Uit openbaarmakingen via 13F-registraties blijkt dat opmerkelijke institutionele beleggers zich bezighouden met Bitcoin ETF's, wat een groeiende acceptatie onderstreept van ...

Meer weten

De dag van de veroordeling breekt aan: het lot van CZ hangt in evenwicht terwijl de Amerikaanse rechtbank het pleidooi van DOJ in overweging neemt

Changpeng Zhao staat vandaag op het punt te worden veroordeeld door een Amerikaanse rechtbank in Seattle.

Meer weten
Sluit u aan bij onze innovatieve technologiegemeenschap
Lees meer
Lees meer
De verschuiving van Donald Trump naar crypto: van tegenstander naar pleitbezorger, en wat dit betekent voor de Amerikaanse cryptocurrency-markt
Business Markten Verhalen en recensies Technologie
De verschuiving van Donald Trump naar crypto: van tegenstander naar pleitbezorger, en wat dit betekent voor de Amerikaanse cryptocurrency-markt
10 mei 2024
Layer3 lanceert deze zomer het L3-token en wijst 51% van het totale aanbod toe aan de gemeenschap
Markten Nieuwsverslag Technologie
Layer3 lanceert deze zomer het L3-token en wijst 51% van het totale aanbod toe aan de gemeenschap
10 mei 2024
Edward Snowdens laatste waarschuwing aan Bitcoin-ontwikkelaars: “Maak van privacy een prioriteit op protocolniveau, anders loop je het risico deze te verliezen
Markten Security Wiki Software Verhalen en recensies Technologie
Edward Snowdens laatste waarschuwing aan Bitcoin-ontwikkelaars: “Maak van privacy een prioriteit op protocolniveau, anders loop je het risico deze te verliezen
10 mei 2024
Door optimisme aangedreven Ethereum Layer 2 Network Mint lanceert zijn mainnet op 15 mei
Nieuwsverslag Technologie
Door optimisme aangedreven Ethereum Layer 2 Network Mint lanceert zijn mainnet op 15 mei
10 mei 2024