Nieuwsverslag Technologie
15 maart 2023

OpenAI Stelt een team van meer dan 50 experts samen om te verbeteren GPT-4's Veiligheid

In het kort

OpenAI heeft een team van meer dan 50 experts ingehuurd om ervoor te zorgen dat zijn nieuwste taalmodel, GPT-4, is veilig voor gebruik.

Het team bestaat uit onderzoekers en ingenieurs die gespecialiseerd zijn in AI-veiligheid, ethiek en beleid.

Het doel is voorkomen GPT-4 om schadelijke of bevooroordeelde inhoud te genereren en ervoor te zorgen dat deze in overeenstemming is met menselijke waarden.

OpenAI Stelt een team van meer dan 50 experts samen om te verbeteren GPT-4's Veiligheid

OpenAI heeft ruim 50 experts uit verschillende domeinen ingehuurd om dit te maken GPT-4 veiliger. De experts hebben gewerkt met vijandige tests van het model om potentiële risico's en kwetsbaarheden te identificeren. Het zijn experts op verschillende gebieden: risico’s op het gebied van AI-uitlijning op de lange termijn, cyberveiligheid, biorisico’s en internationale veiligheid. Hun bevindingen hebben geholpen OpenAI modelgedrag evalueren in gebieden met een hoog risico waarvoor niche-expertise vereist is. 

Hoewel het nieuwste taalmodel vergelijkbare risico's met zich meebrengt als kleinere taalmodellen, zijn de extra mogelijkheden van GPT-4 leiden tot nieuwe bedreigingen. Er is dus sprake geweest van de inschakeling van deskundigen cruciaal voor het garanderen van de veiligheid van de technologie.

OpenAI heeft een extra reeks veiligheidsrelevante versterkingsleren van trainingsaanwijzingen voor menselijke voorkeuren (RLHF) en op regels gebaseerde beloningsmodellen (RBRM's) geïmplementeerd om de veiligheid van de GPT-4 model. De RBRM's zijn zero-shot GPT-4 classifiers die fungeren als een extra beloningssignaal voor de GPT-4 beleidsmodel tijdens de verfijning van de RLHF. Hun doel is om gepast gedrag te stimuleren, zoals het weigeren van het genereren van schadelijke inhoud of het niet afwijzen van ongevaarlijke verzoeken.

Om de veiligheid van de GPT-4 modellen OpenAI begon in augustus 2022 met het rekruteren van externe experts om ‘red teaming’-oefeningen uit te voeren, waaronder stresstests, grenstests en vijandige tests. Ze hadden toegang tot vroege versies van de GPT-4 model en identificeerde initiële risico's die verder veiligheidsonderzoek motiveerden.

De feedback van de experts leidde tot technische maatregelen en beleidshandhavingsmaatregelen om de risico's te verminderen. Er blijven echter veel bedreigingen bestaan ​​en verdere evaluatie is nodig.

Over medewerkers gesproken bij OpenAI, ChatGPT was aanvankelijk ontwikkelde met hulp van individuen in enkele van de armste regio's ter wereld OpenAI's partnerschap met een bedrijf genaamd Sama, dat miljoenen werknemers uit arme gebieden in dienst heeft. Sommige experts op het gebied van AI-ethiek hebben kritiek geuit OpenAI's besluit om de opleiding van haar uit te besteden ChatGPT model naar Sama, die het bedrijf ervan beschuldigt goedkope arbeidskrachten uit te buiten.

Lees verder:

Disclaimer

In lijn met de Richtlijnen voor vertrouwensprojectenHoud er rekening mee dat de informatie op deze pagina niet bedoeld is en niet mag worden geïnterpreteerd als juridisch, fiscaal, beleggings-, financieel of enige andere vorm van advies. Het is belangrijk om alleen te beleggen wat u zich kunt veroorloven te verliezen en onafhankelijk financieel advies in te winnen als u twijfels heeft. Voor meer informatie raden wij u aan de algemene voorwaarden en de hulp- en ondersteuningspagina's van de uitgever of adverteerder te raadplegen. MetaversePost streeft naar nauwkeurige, onpartijdige berichtgeving, maar de marktomstandigheden kunnen zonder voorafgaande kennisgeving worden gewijzigd.

Over de auteur

Agne is een journalist die de laatste trends en ontwikkelingen in de metaverse, AI en Web3 industrieën voor de Metaverse Post. Haar passie voor het vertellen van verhalen heeft ertoe geleid dat ze talloze interviews heeft gehouden met experts op deze gebieden, waarbij ze altijd op zoek is naar spannende en boeiende verhalen. Agne heeft een bachelordiploma in literatuur en een uitgebreide achtergrond in het schrijven over een breed scala aan onderwerpen, waaronder reizen, kunst en cultuur. Ze heeft zich ook vrijwillig aangemeld als redacteur voor de dierenrechtenorganisatie, waar ze hielp het bewustzijn over dierenwelzijnskwesties te vergroten. Neem contact met haar op [e-mail beveiligd].

Meer artikelen
Agne Cimerman
Agne Cimerman

Agne is een journalist die de laatste trends en ontwikkelingen in de metaverse, AI en Web3 industrieën voor de Metaverse Post. Haar passie voor het vertellen van verhalen heeft ertoe geleid dat ze talloze interviews heeft gehouden met experts op deze gebieden, waarbij ze altijd op zoek is naar spannende en boeiende verhalen. Agne heeft een bachelordiploma in literatuur en een uitgebreide achtergrond in het schrijven over een breed scala aan onderwerpen, waaronder reizen, kunst en cultuur. Ze heeft zich ook vrijwillig aangemeld als redacteur voor de dierenrechtenorganisatie, waar ze hielp het bewustzijn over dierenwelzijnskwesties te vergroten. Neem contact met haar op [e-mail beveiligd].

De institutionele belangstelling groeit richting Bitcoin ETF’s te midden van volatiliteit

Uit openbaarmakingen via 13F-registraties blijkt dat opmerkelijke institutionele beleggers zich bezighouden met Bitcoin ETF's, wat een groeiende acceptatie onderstreept van ...

Meer weten

De dag van de veroordeling breekt aan: het lot van CZ hangt in evenwicht terwijl de Amerikaanse rechtbank het pleidooi van DOJ in overweging neemt

Changpeng Zhao staat vandaag op het punt te worden veroordeeld door een Amerikaanse rechtbank in Seattle.

Meer weten
Sluit u aan bij onze innovatieve technologiegemeenschap
Lees meer
Lees meer
Injective bundelt krachten met AltLayer om de beveiliging van inEVM te herstellen
Business Nieuwsverslag Technologie
Injective bundelt krachten met AltLayer om de beveiliging van inEVM te herstellen
3 mei 2024
Masa werkt samen met Teller om MASA Lending Pool te introduceren, waardoor USDC-leningen op de basis mogelijk worden
Markten Nieuwsverslag Technologie
Masa werkt samen met Teller om MASA Lending Pool te introduceren, waardoor USDC-leningen op de basis mogelijk worden
3 mei 2024
Velodrome lanceert de komende weken de bètaversie van Superchain en breidt zich uit over OP Stack Layer 2 Blockchains
Markten Nieuwsverslag Technologie
Velodrome lanceert de komende weken de bètaversie van Superchain en breidt zich uit over OP Stack Layer 2 Blockchains
3 mei 2024
CARV kondigt partnerschap aan met Aethir om zijn datalaag te decentraliseren en beloningen te verdelen
Business Nieuwsverslag Technologie
CARV kondigt partnerschap aan met Aethir om zijn datalaag te decentraliseren en beloningen te verdelen
3 mei 2024