OpenAI laat een krachtige los ChatGPT AI chatbot
In het kort
ChatGPT is het slimste conversationele AI-model
ChatGPT, in contrast met GPT-3, is een model dat zorgvuldig is geleerd om een interactieve chat te voeren en de stroom van het discours in stand te houden. Het model werd gebruikt om te trainen ChatGPT, die begin 2022 werd opgeleid, komt uit de GPT-3.5 series.
Het dialoogformaat maakt dit mogelijk ChatGPT om te reageren op aanvullende vragen, de fouten ervan te erkennen, valse veronderstellingen te weerleggen en irrelevante verzoeken af te wijzen. De chatbot is erg intelligent en kan brieven maken, grappige grappen bedenken en reageren op vragen.
Net als InstruerenGPT, OpenAI gebruikte Reinforcement Learning from Human Feedback (RLHF) om dit model te trainen, met een paar kleine variaties in de manier waarop gegevens werden verzameld. OpenAI maakt gebruik van verfijnde afstemming onder toezicht om een eerste model te trainen door menselijke AI-trainers te laten optreden als zowel de gebruiker als de AI-assistent in chats. Het bood de trainers toegang tot voorbeeldschrijfaanbevelingen om hen te helpen bij het opstellen van hun antwoorden.
Sommige voorbeelden van dialoog worden getoond in de afbeeldingen.
Het was nodig om vergelijkingsgegevens te verzamelen, die bestonden uit twee of meer modelantwoorden gesorteerd op kwaliteit, om een beloningsmodel voor leerversterking te ontwikkelen. Ontwikkelaars namen gesprekken op die AI-trainers voerden met de chatbot om deze informatie te verzamelen. De makers kozen willekeurig een op een model geschreven verklaring, proefden een aantal mogelijke conclusies en vroegen AI-trainers om ze te rangschikken. Het kan het model aanpassen met behulp van Proximal Policy Optimization met behulp van deze beloningsmodellen.
Praat met deze chatbot hier. De servers zijn momenteel echter vol.
Lees meer over GPT-3:
Disclaimer
In lijn met de Richtlijnen voor vertrouwensprojectenHoud er rekening mee dat de informatie op deze pagina niet bedoeld is en niet mag worden geïnterpreteerd als juridisch, fiscaal, beleggings-, financieel of enige andere vorm van advies. Het is belangrijk om alleen te beleggen wat u zich kunt veroorloven te verliezen en onafhankelijk financieel advies in te winnen als u twijfels heeft. Voor meer informatie raden wij u aan de algemene voorwaarden en de hulp- en ondersteuningspagina's van de uitgever of adverteerder te raadplegen. MetaversePost streeft naar nauwkeurige, onpartijdige berichtgeving, maar de marktomstandigheden kunnen zonder voorafgaande kennisgeving worden gewijzigd.
Over de auteur
Damir is de teamleider, productmanager en redacteur bij Metaverse Post, met onderwerpen als AI/ML, AGI, LLM's, Metaverse en Web3-gerelateerde velden. Zijn artikelen trekken maandelijks een enorm publiek van meer dan een miljoen gebruikers. Hij blijkt een expert te zijn met 10 jaar ervaring in SEO en digitale marketing. Damir is genoemd in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto en andere publicaties. Hij reist als digitale nomade tussen de VAE, Turkije, Rusland en het GOS. Damir behaalde een bachelordiploma in natuurkunde, wat hem volgens hem de kritische denkvaardigheden heeft gegeven die nodig zijn om succesvol te zijn in het steeds veranderende landschap van internet.
Meer artikelenDamir is de teamleider, productmanager en redacteur bij Metaverse Post, met onderwerpen als AI/ML, AGI, LLM's, Metaverse en Web3-gerelateerde velden. Zijn artikelen trekken maandelijks een enorm publiek van meer dan een miljoen gebruikers. Hij blijkt een expert te zijn met 10 jaar ervaring in SEO en digitale marketing. Damir is genoemd in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto en andere publicaties. Hij reist als digitale nomade tussen de VAE, Turkije, Rusland en het GOS. Damir behaalde een bachelordiploma in natuurkunde, wat hem volgens hem de kritische denkvaardigheden heeft gegeven die nodig zijn om succesvol te zijn in het steeds veranderende landschap van internet.