OpenAI allibera un poderós ChatGPT Chatbot AI
En breu
ChatGPT és el model d'IA conversacional més intel·ligent
ChatGPT, en contrast amb GPT-3, és un model que s'ha ensenyat acuradament a mantenir un xat interactiu i mantenir el flux del discurs. El model utilitzat per entrenar ChatGPT, que es va fer la formació a principis del 2022, és del GPT-3.5 sèrie.
El format de diàleg habilita ChatGPT per respondre a consultes addicionals, reconèixer els seus errors, refutar suposicions falses i rebutjar sol·licituds irrellevants. El chatbot és molt intel·ligent i pot crear cartes, fer bromes divertides i respondre a les consultes.
Igual que InstructGPT, OpenAI va utilitzar Reinforcement Learning from Human Feedback (RLHF) per entrenar aquest model, amb algunes variacions menors en la disposició de recollida de dades. OpenAI utilitza un ajustament supervisat per entrenar un model inicial fent que els entrenadors humans d'IA actuïn tant com a usuari com a assistent d'IA als xats. Va proporcionar als formadors accés a recomanacions d'escriptura de mostra per ajudar-los a crear les seves respostes.
Algunes mostres de diàleg es mostren a les imatges.
Va ser necessari recollir dades de comparació, que consistien en dos o més respostes model classificades per qualitat, per tal de desenvolupar un model de recompensa per a l'aprenentatge de reforç. Els desenvolupadors van gravar les discussions que els entrenadors d'IA van dur a terme amb el chatbot per tal de recopilar aquesta informació. Els creadors van triar una declaració escrita per un model a l'atzar, van mostrar una sèrie de conclusions potencials i van demanar als entrenadors d'IA que les classifiquessin. Pot ajustar el model mitjançant l'optimització de polítiques proximals utilitzant aquests models de recompensa.
Parla amb aquest bot de xat aquí. Tanmateix, actualment els servidors estan plens.
Llegiu més sobre GPT-3:
renúncia
En línia amb la Directrius del projecte Trust, si us plau, tingueu en compte que la informació proporcionada en aquesta pàgina no pretén ni s'ha d'interpretar com a assessorament legal, fiscal, d'inversió, financer o de cap altra forma. És important invertir només el que et pots permetre perdre i buscar assessorament financer independent si tens dubtes. Per obtenir més informació, us suggerim que feu referència als termes i condicions, així com a les pàgines d'ajuda i assistència proporcionades per l'emissor o l'anunciant. MetaversePost es compromet a fer informes precisos i imparcials, però les condicions del mercat estan subjectes a canvis sense previ avís.
About The Autor
Damir és el líder d'equip, cap de producte i editor de Metaverse Post, que cobreix temes com AI/ML, AGI, LLMs, Metaverse i Web3-camps relacionats. Els seus articles atrauen una audiència massiva de més d'un milió d'usuaris cada mes. Sembla ser un expert amb 10 anys d'experiència en SEO i màrqueting digital. Damir ha estat esmentat a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i altres publicacions. Viatja entre els Emirats Àrabs Units, Turquia, Rússia i la CEI com a nòmada digital. Damir va obtenir una llicenciatura en física, que creu que li ha donat les habilitats de pensament crític necessàries per tenir èxit en el paisatge en constant canvi d'Internet.
més articlesDamir és el líder d'equip, cap de producte i editor de Metaverse Post, que cobreix temes com AI/ML, AGI, LLMs, Metaverse i Web3-camps relacionats. Els seus articles atrauen una audiència massiva de més d'un milió d'usuaris cada mes. Sembla ser un expert amb 10 anys d'experiència en SEO i màrqueting digital. Damir ha estat esmentat a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i altres publicacions. Viatja entre els Emirats Àrabs Units, Turquia, Rússia i la CEI com a nòmada digital. Damir va obtenir una llicenciatura en física, que creu que li ha donat les habilitats de pensament crític necessàries per tenir èxit en el paisatge en constant canvi d'Internet.