Alle grote technologiebedrijven die LLM's ontwikkelen, moeten prioriteit geven aan modelbeveiliging
In het kort
Onderzoekers creëerden een systeem dat combineert grote taalmodellen voor autonoom ontwerp, planning en uitvoering van wetenschappelijke experimenten, waarbij het zijn onderzoekscapaciteiten demonstreert in drie verschillende gevallen.
Het model schreef code voor chemische vergelijkingen om te begrijpen hoeveel stof nodig is voor de reactie.
De dit artikel "Opkomende autonome wetenschappelijke onderzoeksmogelijkheden van grote taalmodellen" onderzoekt het idee om een systeem te creëren dat verschillende grote taalmodellen combineert voor autonoom ontwerp, planning en uitvoering van wetenschappelijke experimenten. Het demonstreert de onderzoekscapaciteiten van de agent in drie verschillende gevallen, waarvan de moeilijkste de succesvolle implementatie van gekatalyseerde reacties is.
De hoofdstelling van dit artikel is:
- Onderzoekers hebben een bibliotheek gevonden waarmee je code in Python kunt schrijven en vervolgens opdrachten voor uitvoering kunt overbrengen naar een speciaal apparaat voor het uitvoeren van experimenten (met het mengen van stoffen);
- Onderzoekers gebruikten GPT-4 voor zoeken op internet en bibliotheekdocumentatie, evenals de mogelijkheid om Python-code uit te voeren (om experimenten uit te voeren);
- Er is een planner op het hoogste niveau (ook GPT-4), die de oorspronkelijke aanvraag analyseert en een ‘onderzoeksplan’ opstelt.
- GPT-4 doet goed werk door eenvoudige niet-chemische taken uit te voeren, zoals het maken van bepaalde vormen op een chemisch bord (cellen correct vullen met stoffen).
- Ze probeerden een meer complexe en toegepaste taak om een reactie uit te voeren; het model deed het goed en handelde logisch.
- Daarna gaven ze het model verschillende taken voor het uitvoeren van experimenten; voor wat het model opleverde, werden echter geen echte experimenten uitgevoerd.
- Bovendien schreef het model de code voor chemische vergelijkingen meerdere keren om te beoordelen hoeveel stof nodig is voor de reactie.
- Er werd ook gevraagd om een remedie tegen kanker te creëren. Het model benaderde de analyse logisch en methodisch. Eerst "keek" het online naar huidige trends in het ontdekken van geneesmiddelen tegen kanker. Vervolgens koos het model een molecuul dat zou worden gebruikt voor het modelleren van het medicijn en schreef de code voor de synthese ervan. Mensen voerden de code niet uit (en ik zag geen analyse van de geschiktheid ervan).
- Daarnaast werd het gevraagd om verschillende gevaarlijke stoffen zoals drugs en gifstoffen te synthetiseren.
Hier is het meest interessante deel. Voor sommige verzoeken weigerde het model onmiddellijk te werken (bijvoorbeeld heroïne of mosterdgas, een uiterst gevaarlijk gifgas). Voor anderen begon Google hoe ze de stoffen moesten maken, maar realiseerden zich dat ze voor illegale doeleinden konden worden gebruikt en weigerden verder te werken. Voor anderen schreef het een onderzoeksplan en code voor de stofsynthese.
Deze “weigering” is waarschijnlijk omdat GPT-4 is ontworpen om het verzoek te analyseren en als hem wordt gevraagd iets illegaals of gevaarlijks te doen, weigert hij onmiddellijk het verzoek uit te voeren. Het is echt gaaf dat het resultaat van de uitlijningsprocedure merkbaar is.
En aan het einde van het artikel dringen de auteurs er allemaal op aan bedrijven die LLM's ontwikkelen om prioriteit te geven aan de veiligheid van modellen.
- Onderzoekers van de Universiteit van Californië creëerden de Machiavelli-benchmark om de competentie en schadelijkheid van AI-modellen te meten in een brede omgeving van langdurige taalinteracties. Deze test maakt gebruik van oplossingen op hoog niveau om agenten realistische doelen te geven en interacties op laag niveau weg te abstraheren.
- De intellectuele revolutie gekenmerkt door ChatGPT is een triade van synergetisch sublieme revoluties: technologisch, techno-humanitair en sociaal-politiek. Om uitgebreid te kijken naar wat er gebeurt, is het aan te raden om ernaar te luisteren drie frisse invalshoeken van intellectuelen op het gebied van filosofie, geschiedenis en innovatie.
- Het verhaal van de petitie om te stoppen met het ontwikkelen van AI-systemen die geavanceerder zijn dan GPT-4 heeft de samenleving gepolariseerd. Een artikel geeft voorbeelden van wanneer processen in een onverwachte richting gaan. Risico's van kwaadwillig gebruik van AI en misbruik worden niet overwogen, wat leidt tot het argument dat we bang moeten zijn voor mensen en niet voor AI zelf.
Lees meer over AI:
Disclaimer
In lijn met de Richtlijnen voor vertrouwensprojectenHoud er rekening mee dat de informatie op deze pagina niet bedoeld is en niet mag worden geïnterpreteerd als juridisch, fiscaal, beleggings-, financieel of enige andere vorm van advies. Het is belangrijk om alleen te beleggen wat u zich kunt veroorloven te verliezen en onafhankelijk financieel advies in te winnen als u twijfels heeft. Voor meer informatie raden wij u aan de algemene voorwaarden en de hulp- en ondersteuningspagina's van de uitgever of adverteerder te raadplegen. MetaversePost streeft naar nauwkeurige, onpartijdige berichtgeving, maar de marktomstandigheden kunnen zonder voorafgaande kennisgeving worden gewijzigd.
Over de auteur
Damir is de teamleider, productmanager en redacteur bij Metaverse Post, met onderwerpen als AI/ML, AGI, LLM's, Metaverse en Web3-gerelateerde velden. Zijn artikelen trekken maandelijks een enorm publiek van meer dan een miljoen gebruikers. Hij blijkt een expert te zijn met 10 jaar ervaring in SEO en digitale marketing. Damir is genoemd in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto en andere publicaties. Hij reist als digitale nomade tussen de VAE, Turkije, Rusland en het GOS. Damir behaalde een bachelordiploma in natuurkunde, wat hem volgens hem de kritische denkvaardigheden heeft gegeven die nodig zijn om succesvol te zijn in het steeds veranderende landschap van internet.
Meer artikelenDamir is de teamleider, productmanager en redacteur bij Metaverse Post, met onderwerpen als AI/ML, AGI, LLM's, Metaverse en Web3-gerelateerde velden. Zijn artikelen trekken maandelijks een enorm publiek van meer dan een miljoen gebruikers. Hij blijkt een expert te zijn met 10 jaar ervaring in SEO en digitale marketing. Damir is genoemd in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto en andere publicaties. Hij reist als digitale nomade tussen de VAE, Turkije, Rusland en het GOS. Damir behaalde een bachelordiploma in natuurkunde, wat hem volgens hem de kritische denkvaardigheden heeft gegeven die nodig zijn om succesvol te zijn in het steeds veranderende landschap van internet.