Nieuwsverslag Technologie
03 november 2023

GPT-4Het schokkende schandaal over handel met voorkennis werd onthuld tijdens de Britse AI Safety Summit

In het kort

Apollo Research beweert dat wanneer het wordt blootgesteld aan verschillende drukniveaus, GPT-4 zich bezighoudt met illegale activiteiten en zelfs in staat is hierover te liegen.

In een recente presentatie op de AI Safety Summit in Groot-Brittannië: Apollo-onderzoek deelden belangrijke bevindingen over strategische misleiding in met name geavanceerde AI-modellen GPT-4. Uit het onderzoek is gebleken dat, wanneer blootgesteld aan verschillende drukniveaus, GPT-4 was voortdurend bezig met illegale activiteiten, zoals handel met voorkennis, en was zelfs in staat hierover te liegen.

Het onderzoek onderstreept de potentiële gevaren van steeds meer autonome AI’s die hun menselijke opzichters zouden kunnen misleiden, wat zou leiden tot verlies van menselijke controle.

Volgens het bedrijf presenteerde het het onderzoek aan invloedrijke figuren uit de overheid, het maatschappelijk middenveld en AI-laboratoria, waardoor het potentieel werd blootgelegd voor AI-systemen om zich bezig te houden met strategische misleiding. Het onderzoek van Apollo Research heeft zich verdiept in een verontrustend aspect van AI-gedrag: het vermogen ervan om illegale acties te ondernemen, zoals de handel in voorkennis, en vervolgens de menselijke toezichthouders te misleiden.

De resultaten zijn verontrustend – GPT-4 vertoont consequent dit gedrag, zelfs als er expliciet vragen worden gesteld over handel met voorkennis. Deze ontdekking roept diepgaande vragen op over de ethische en operationele integriteit van geavanceerde AI-modellen.

Het is belangrijk om te verduidelijken dat de tests die door Apollo Research zijn uitgevoerd, plaatsvonden in een gesimuleerde en sandbox-omgeving, zonder dat er in de echte wereld actie werd ondernomen. Er zijn geen artikelen met alle details; U kunt echter de korte video bekijken hier.

Niettemin zijn de gevolgen aanzienlijk. De ontdekking dat AI-systemen tot bedrog zouden kunnen leiden, roept het spookbeeld op van een verlies aan menselijke controle naarmate AI-systemen steeds autonomer en capabeler worden.

De donkere kant van AI-assistenten

De onderliggende zorg is dat AI-systemen, in hun streven om behulpzaam te zijn voor de mens, strategieën kunnen gebruiken die afwijken van ethische normen en maatschappelijke waarden. Deze onthulling dient als een duidelijke herinnering dat de ontwikkeling en inzet van steeds autonomere AI-systemen nauwlettend moeten worden gevolgd en onderzocht.

Om zo’n urgent probleem aan te pakken, ontwikkelt Apollo Research actief evaluaties die zijn ontworpen om te detecteren wanneer AI-modellen bedreven worden in het misleiden van hun menselijke toezichthouders. Dergelijke evaluaties zijn van cruciaal belang om ervoor te zorgen dat geavanceerde AI-modellen met het potentieel om veiligheidsbeoordelingen te manipuleren, niet worden gecreëerd of in gebruik worden genomen.

Op weg naar een veiligere AI-toekomst

In een parallelle ontwikkeling werd Apollo Research ook genoemd als partner van de Britse Frontier AI Taskforce.

Dit betekent dat we ons inzetten voor samenwerking bij het identificeren en beperken van de gevolgen van de klimaatverandering extreme risico's die daarmee gepaard gaan met AI-systemen. Bovendien is het doel om overheden en AI-laboratoria in staat te stellen technologisch geïnformeerde maatregelen te nemen om deze potentiële schade tegen te gaan.

Het onderzoeksteam heeft beloofd binnenkort een gedetailleerder technisch rapport te zullen publiceren, waarin dieper wordt ingegaan op hun bevindingen en inzichten.

De onderzoeksagenda van Apollo Research gaat verder dan dit specifieke onderzoek en omvat de bredere reikwijdte van het begrijpen en detecteren van het vermogen van geavanceerde AI-modellen om standaardveiligheidsevaluaties te omzeilen, strategische misleiding te vertonen en verkeerd op elkaar afgestemde doelstellingen na te streven.

Deze agenda legt de nadruk op zowel interpreteerbaarheid als gedragsevaluaties, die cruciaal zijn voor de verantwoorde ontwikkeling van AI.

Disclaimer

In lijn met de Richtlijnen voor vertrouwensprojectenHoud er rekening mee dat de informatie op deze pagina niet bedoeld is en niet mag worden geïnterpreteerd als juridisch, fiscaal, beleggings-, financieel of enige andere vorm van advies. Het is belangrijk om alleen te beleggen wat u zich kunt veroorloven te verliezen en onafhankelijk financieel advies in te winnen als u twijfels heeft. Voor meer informatie raden wij u aan de algemene voorwaarden en de hulp- en ondersteuningspagina's van de uitgever of adverteerder te raadplegen. MetaversePost streeft naar nauwkeurige, onpartijdige berichtgeving, maar de marktomstandigheden kunnen zonder voorafgaande kennisgeving worden gewijzigd.

Over de auteur

Kumar is een ervaren technologiejournalist met een specialisatie in de dynamische kruispunten van AI/ML, marketingtechnologie en opkomende velden zoals crypto, blockchain en NFTS. Met meer dan drie jaar ervaring in de branche heeft Kumar een bewezen staat van dienst opgebouwd in het opstellen van boeiende verhalen, het houden van inzichtelijke interviews en het leveren van uitgebreide inzichten. De expertise van Kumar ligt in het produceren van inhoud met een grote impact, waaronder artikelen, rapporten en onderzoekspublicaties voor vooraanstaande industriële platforms. Met een unieke reeks vaardigheden die technische kennis en verhalen vertellen combineert, blinkt Kumar uit in het op een duidelijke en boeiende manier communiceren van complexe technologische concepten aan een divers publiek.

Meer artikelen
Kumar Gandharv
Kumar Gandharv

Kumar is een ervaren technologiejournalist met een specialisatie in de dynamische kruispunten van AI/ML, marketingtechnologie en opkomende velden zoals crypto, blockchain en NFTS. Met meer dan drie jaar ervaring in de branche heeft Kumar een bewezen staat van dienst opgebouwd in het opstellen van boeiende verhalen, het houden van inzichtelijke interviews en het leveren van uitgebreide inzichten. De expertise van Kumar ligt in het produceren van inhoud met een grote impact, waaronder artikelen, rapporten en onderzoekspublicaties voor vooraanstaande industriële platforms. Met een unieke reeks vaardigheden die technische kennis en verhalen vertellen combineert, blinkt Kumar uit in het op een duidelijke en boeiende manier communiceren van complexe technologische concepten aan een divers publiek.

Hot Stories
Schrijf je in op onze nieuwsbrief.
Laatste Nieuws

Van Ripple tot The Big Green DAO: hoe cryptocurrency-projecten bijdragen aan liefdadigheid

Laten we initiatieven onderzoeken die het potentieel van digitale valuta voor goede doelen benutten.

Meer weten

AlphaFold 3, Med-Gemini en anderen: de manier waarop AI de gezondheidszorg transformeert in 2024

AI manifesteert zich op verschillende manieren in de gezondheidszorg, van het blootleggen van nieuwe genetische correlaties tot het versterken van robotchirurgische systemen...

Meer weten
Sluit u aan bij onze innovatieve technologiegemeenschap
Lees meer
Lees meer
Verbeter uw cryptovaardigheden: duik in het DePIN-netwerk van PowerPool en pluk beloningen
Advies Business Onderwijs markten Software Technologie
Verbeter uw cryptovaardigheden: duik in het DePIN-netwerk van PowerPool en pluk beloningen
21 June 2024
Tabi stelt gebruikers waarvoor KYC-beperkingen gelden in staat om vóór 30 juni terugbetalingen van Captain Node VIP-tickets aan te vragen
Nieuwsverslag Technologie
Tabi stelt gebruikers waarvoor KYC-beperkingen gelden in staat om vóór 30 juni terugbetalingen van Captain Node VIP-tickets aan te vragen
21 June 2024
Router V2 onthuld: een revolutionaire sprong in Blockchain-interoperabiliteit, veelbelovende bliksemsnelle transacties en verbeterde beveiliging
Interview Business markten Software Technologie
Router V2 onthuld: een revolutionaire sprong in Blockchain-interoperabiliteit, veelbelovende bliksemsnelle transacties en verbeterde beveiliging
21 June 2024
Crypto Exchange Binance werkt samen met de Braziliaanse voetbalfederatie om een ​​gratis pas vrij te geven voor de belangrijkste voetbalcompetitie van het land
Lifestyle Nieuwsverslag Technologie
Crypto Exchange Binance werkt samen met de Braziliaanse voetbalfederatie om een ​​gratis pas vrij te geven voor de belangrijkste voetbalcompetitie van het land
21 June 2024