Nieuwsverslag SMW Technologie
10 mei 2023

Anthropic stelt een 'contextuele AI' voor chatmodellen voor op basis van 60 principes

In het kort

OpenAI maakt gebruik van versterkend leren van menselijke feedback (RLHF) om op één lijn te komen taalmodellen met menselijke principes, veiligheid en bruikbaarheid.

Anthropic stelde een alternatieve benadering voor: contextuele AI, waarbij mensen een grondwet schrijven die het model zou moeten volgen.

Deze grondwet is gebaseerd op de Verklaring van de Rechten van de Mens van de Verenigde Naties, de Servicevoorwaarden van Apple en de Principes die de overweging van niet-westerse perspectieven stimuleren.

Anthropic heeft een nieuwe benadering voorgesteld voor het trainen van chatmodellen met behulp van 'Constitutionele AI'. Deze methode bouwt voort OpenAI's versterking van leren gebaseerd op menselijke feedback, maar bouwt erop voort door de noodzaak te vermijden om diepgaande trainingsvoorbeelden te schrijven. In plaats daarvan wordt het model getraind om te reageren op input door het gebruik van een grondwet die bedoeld is om te fungeren als een reeks wetten die het model moet volgen.

Anthropic stelt een 'contextuele AI' voor chatmodellen voor op basis van 60 principes
antropisch.com
Aanbevolen: Ex-OpenAI medewerkers richtten Anthropic op, een bedrijf dat meer dan $ 700 miljoen aan financiering heeft aangetrokken

Via deze methode kan de AI zijn eigen trainingsvoorbeelden genereren door te evalueren wat hij heeft gezegd in vergelijking met zijn reeks wettelijk aanvaarde principes. Deze tijdbesparende techniek kan worden gezien als Isaac Asimov's Wetten van robotica in praktijk brengen.

De principes die de basis vormen van het model zijn te talrijk om in detail te bespreken. Ze behandelen echter veel onderwerpen, zoals moraliteit, risicoaversie, economie en kunstmatige intelligentie. Elk is ontwikkeld om de beslissingen van de AI te helpen sturen als het gaat om het reageren op gespreksaanwijzingen.

Anthropic is erin geslaagd om effectief een AI-model genaamd Claude te trainen, waarmee hij succesvol concurreert OpenAI's ChatGPT. De ... gebruiken Grondwet-AI-methodeClaude kon met een indrukwekkende nauwkeurigheid reageren op conversatie-aanwijzingen, maar er worden nog meer verbeteringen verwacht naarmate Anthropic blijft voortbouwen op deze baanbrekende technologie.

Aan de hand van de reeks principes en enkele procesvoorbeelden wordt het model tijdens de eerste fase geleerd hoe het zijn eigen antwoorden moet evalueren en herzien. De tweede fase omvat het trainen van een model met behulp van versterkend leren, maar in plaats van input van mensen te gebruiken, gebruikt het AI-gegenereerde feedback op basis van een reeks principes om de meer goedaardige output te selecteren.

Deze nieuwe aanpak heeft inderdaad het potentieel om tijd en geld te besparen voor bedrijven die niet langer hun eigen trainingsvoorbeelden hoeven te maken. Deze 'kant-en-klare' methode kan eerder worden gebruikt als basis voor het maken van op maat gemaakte modellen - er is geen programmeerkennis vereist. Het is ook belangrijk op te merken hoe deze technologie ook belooft de veiligheid te vergroten als het gaat om conversatiebots. Het creëren van een reeks wettelijk aanvaarde principes verkleint het risico van de AI die schurkenstaten wordt.

Daarom belooft Constituation AI niet alleen de ontwikkeling van chatmodellen gemakkelijker en sneller te maken, maar het zal het ook veiliger maken. Een win-win situatie voor zowel de wereld van Artificial Intelligence als ChatBots.

Een analytische kijk op de "contextuele AI" van Anthropic voor chatbots

De contextuele AI van Anthropic is gebaseerd op de integratie van meer dan 60 principes die zijn ontleend aan de Verklaring van de Rechten van de Mens van de Verenigde Naties, de servicevoorwaarden van Apple, de principes die de overweging van niet-westerse perspectieven stimuleren, van Deepmind Sparrow-regels en antropisch onderzoek Set 1 en Set 2.

Het feit dat AI nu kan worden geleerd zich te gedragen volgens principes die zijn afgeleid van zo’n uitgebreid en divers scala aan bronnen, is werkelijk opmerkelijk. Door bijvoorbeeld principes uit de Verklaring van de Rechten van de Mens van de Verenigde Naties op te nemen, weerspiegelen de antwoorden op chatbots nu het belang van het behoud van het idee van vrijheid, gelijkheid en broederschap. Dergelijke beginselen zijn een essentieel onderdeel om dat te garanderen chatbot-gesprekken blijf ethisch en respectvol. Op dezelfde manier garandeert de opname van de Servicevoorwaarden van Apple dat de Chatbot houdt rekening met de privacybelangen van haar gebruikers.

Principes die het nadenken over niet-westerse perspectieven stimuleren, spelen ook een belangrijke rol in het 'Contextual AI'-model. Deze principes weerspiegelen de noodzaak voor AI om andere culturen te respecteren en ervoor te zorgen dat reacties van chatbots niet als schadelijk of aanstootgevend worden ervaren. Evenzo schrijven de Sparrow-regels van Deepmind voor dat de chatbot reageert met reacties die bedoeld zijn om een ​​relatie met de gebruiker op te bouwen.

De integratie van Anthropic Research Set 1 en Set 2 biedt de laatste garantie dat AI-gesprekken beschaafd en respectvol blijven. De AI is getraind om ervoor te zorgen dat het vragen op een doordachte en hoffelijke manier beantwoordt.

Al met al is het “Contextual AI”-model van Anthropic een ontzettend belangrijke doorbraak op het gebied van AI-onderzoek. Door toe te staan ​​dat AI wordt onderwezen volgens principes die zijn afgeleid van zo'n uiteenlopende reeks bronnen, worden de ethische implicaties van geautomatiseerde gesprekken aanzienlijk verbeterd.

Lees meer over AI:

Disclaimer

In lijn met de Richtlijnen voor vertrouwensprojectenHoud er rekening mee dat de informatie op deze pagina niet bedoeld is en niet mag worden geïnterpreteerd als juridisch, fiscaal, beleggings-, financieel of enige andere vorm van advies. Het is belangrijk om alleen te beleggen wat u zich kunt veroorloven te verliezen en onafhankelijk financieel advies in te winnen als u twijfels heeft. Voor meer informatie raden wij u aan de algemene voorwaarden en de hulp- en ondersteuningspagina's van de uitgever of adverteerder te raadplegen. MetaversePost streeft naar nauwkeurige, onpartijdige berichtgeving, maar de marktomstandigheden kunnen zonder voorafgaande kennisgeving worden gewijzigd.

Over de auteur

Damir is de teamleider, productmanager en redacteur bij Metaverse Post, met onderwerpen als AI/ML, AGI, LLM's, Metaverse en Web3-gerelateerde velden. Zijn artikelen trekken maandelijks een enorm publiek van meer dan een miljoen gebruikers. Hij blijkt een expert te zijn met 10 jaar ervaring in SEO en digitale marketing. Damir is genoemd in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto en andere publicaties. Hij reist als digitale nomade tussen de VAE, Turkije, Rusland en het GOS. Damir behaalde een bachelordiploma in natuurkunde, wat hem volgens hem de kritische denkvaardigheden heeft gegeven die nodig zijn om succesvol te zijn in het steeds veranderende landschap van internet. 

Meer artikelen
Damir Jalalov
Damir Jalalov

Damir is de teamleider, productmanager en redacteur bij Metaverse Post, met onderwerpen als AI/ML, AGI, LLM's, Metaverse en Web3-gerelateerde velden. Zijn artikelen trekken maandelijks een enorm publiek van meer dan een miljoen gebruikers. Hij blijkt een expert te zijn met 10 jaar ervaring in SEO en digitale marketing. Damir is genoemd in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto en andere publicaties. Hij reist als digitale nomade tussen de VAE, Turkije, Rusland en het GOS. Damir behaalde een bachelordiploma in natuurkunde, wat hem volgens hem de kritische denkvaardigheden heeft gegeven die nodig zijn om succesvol te zijn in het steeds veranderende landschap van internet. 

De institutionele belangstelling groeit richting Bitcoin ETF’s te midden van volatiliteit

Uit openbaarmakingen via 13F-registraties blijkt dat opmerkelijke institutionele beleggers zich bezighouden met Bitcoin ETF's, wat een groeiende acceptatie onderstreept van ...

Meer weten

De dag van de veroordeling breekt aan: het lot van CZ hangt in evenwicht terwijl de Amerikaanse rechtbank het pleidooi van DOJ in overweging neemt

Changpeng Zhao staat vandaag op het punt te worden veroordeeld door een Amerikaanse rechtbank in Seattle.

Meer weten
Sluit u aan bij onze innovatieve technologiegemeenschap
Lees meer
Lees meer
Injective bundelt krachten met AltLayer om de beveiliging van inEVM te herstellen
Business Nieuwsverslag Technologie
Injective bundelt krachten met AltLayer om de beveiliging van inEVM te herstellen
3 mei 2024
Masa werkt samen met Teller om MASA Lending Pool te introduceren, waardoor USDC-leningen op de basis mogelijk worden
Markten Nieuwsverslag Technologie
Masa werkt samen met Teller om MASA Lending Pool te introduceren, waardoor USDC-leningen op de basis mogelijk worden
3 mei 2024
Velodrome lanceert de komende weken de bètaversie van Superchain en breidt zich uit over OP Stack Layer 2 Blockchains
Markten Nieuwsverslag Technologie
Velodrome lanceert de komende weken de bètaversie van Superchain en breidt zich uit over OP Stack Layer 2 Blockchains
3 mei 2024
CARV kondigt partnerschap aan met Aethir om zijn datalaag te decentraliseren en beloningen te verdelen
Business Nieuwsverslag Technologie
CARV kondigt partnerschap aan met Aethir om zijn datalaag te decentraliseren en beloningen te verdelen
3 mei 2024