OpenAI släpper en kraftfull ChatGPT AI chatbot
I korthet
ChatGPT är den smartaste konversations-AI-modellen
ChatGPT, i kontrast till GPT-3, är en modell som noggrant har lärts ut att föra en interaktiv chatt och upprätthålla flödet i diskursen. Modellen som användes för att träna ChatGPT, som tränades i början av 2022, är från GPT-3.5 serien.
Dialogformatet aktiverar ChatGPT att svara på ytterligare frågor, erkänna dess fel, motbevisa falska antaganden och avslå irrelevanta förfrågningar. Chatboten är väldigt intelligent och kan skapa brev, komma med roliga skämt och svara på förfrågningar.
Precis som InstructGPT, OpenAI använde Reinforcement Learning from Human Feedback (RLHF) för att träna denna modell, med några mindre variationer i datainsamlingsarrangemanget. OpenAI använder övervakad finjustering för att träna en initial modell genom att låta mänskliga AI-tränare agera både som användare och AI-assistent i chattar. Det gav utbildarna tillgång till exempelskrivrekommendationer för att hjälpa dem att skapa sina svar.
Några exempel på dialog visas på bilderna.
Det var nödvändigt att samla in jämförelsedata, som bestod av två eller flera modellsvar graderade efter kvalitet, för att utveckla en belöningsmodell för förstärkningsinlärning. Utvecklare spelade in diskussioner som AI-tränare genomförde med chatboten för att samla in denna information. Skaparna valde slumpmässigt ett modellskrivet uttalande, tog ett urval av ett antal potentiella slutsatser och bad AI-tränare att rangordna dem. Den kan justera modellen med hjälp av proximal policyoptimering genom att använda dessa belöningsmodeller.
Prata med den här chatboten här. Men servrarna är för närvarande fulla.
Läs mer om GPT-3:
Villkor
I linje med den Riktlinjer för Trust Project, vänligen notera att informationen på den här sidan inte är avsedd att vara och inte ska tolkas som juridisk, skattemässig, investerings-, finansiell eller någon annan form av rådgivning. Det är viktigt att bara investera det du har råd att förlora och att söka oberoende finansiell rådgivning om du har några tvivel. För ytterligare information föreslår vi att du hänvisar till villkoren samt hjälp- och supportsidorna som tillhandahålls av utfärdaren eller annonsören. MetaversePost är engagerad i korrekt, opartisk rapportering, men marknadsförhållandena kan ändras utan föregående meddelande.
Om författaren
Damir är teamledare, produktchef och redaktör på Metaverse Post, som täcker ämnen som AI/ML, AGI, LLMs, Metaverse och Web3-relaterade områden. Hans artiklar lockar en massiv publik på över en miljon användare varje månad. Han verkar vara en expert med 10 års erfarenhet av SEO och digital marknadsföring. Damir har nämnts i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto och andra publikationer. Han reser mellan Förenade Arabemiraten, Turkiet, Ryssland och OSS som en digital nomad. Damir tog en kandidatexamen i fysik, som han tror har gett honom de kritiska tänkande färdigheter som behövs för att bli framgångsrik i det ständigt föränderliga landskapet på internet.
fler artiklarDamir är teamledare, produktchef och redaktör på Metaverse Post, som täcker ämnen som AI/ML, AGI, LLMs, Metaverse och Web3-relaterade områden. Hans artiklar lockar en massiv publik på över en miljon användare varje månad. Han verkar vara en expert med 10 års erfarenhet av SEO och digital marknadsföring. Damir har nämnts i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto och andra publikationer. Han reser mellan Förenade Arabemiraten, Turkiet, Ryssland och OSS som en digital nomad. Damir tog en kandidatexamen i fysik, som han tror har gett honom de kritiska tänkande färdigheter som behövs för att bli framgångsrik i det ständigt föränderliga landskapet på internet.