OpenAI освобождава мощен ChatGPT AI чат бот
Накратко
ChatGPT е най-умният разговорен AI модел
ChatGPT, За разлика GPT-3, е модел, който е внимателно научен да води интерактивен чат и да поддържа потока на дискурса. Моделът е тренирал ChatGPT, което беше направено обучение в началото на 2022 г., е от GPT-3.5 серия.
Диалоговият формат позволява ChatGPT да отговаря на допълнителни запитвания, да признава своите грешки, да опровергава неверни предположения и да отхвърля неуместни заявки. Чатботът е много интелигентен и може да създава писма, да измисля забавни вицове и да отговаря на запитвания.
Точно като InstructGPT, OpenAI използва Reinforcement Learning from Human Feedback (RLHF), за да обучи този модел, с няколко незначителни вариации в организацията за събиране на данни. OpenAI използва контролирана фина настройка, за да обучи първоначален модел, като накара човешките AI обучители да действат едновременно като потребител и AI асистент в чатове. Той предостави на обучителите достъп до примерни препоръки за писане, за да им помогне при създаването на техните отговори.
Някои примери за диалог са показани на изображенията.
Беше необходимо да се съберат сравнителни данни, които се състоеха от два или повече отговора на модела, класифицирани по качество, за да се разработи модел на възнаграждение за обучение с подсилване. Разработчиците записаха дискусии, които AI обучителите проведоха с чатбота, за да съберат тази информация. Създателите избраха произволно изявление, написано като модел, взеха проби от редица потенциални заключения и помолиха обучителите на AI да ги класират. Той може да коригира модела с помощта на оптимизация на проксималната политика, като използва тези модели на възнаграждение.
Говорете с този чатбот тук. В момента обаче сървърите са пълни.
Прочетете повече за GPT-3:
Отказ от отговорност
В съответствие с Доверете се насоките на проекта, моля, имайте предвид, че предоставената на тази страница информация не е предназначена да бъде и не трябва да се тълкува като правен, данъчен, инвестиционен, финансов или каквато и да е друга форма на съвет. Важно е да инвестирате само това, което можете да си позволите да загубите, и да потърсите независим финансов съвет, ако имате някакви съмнения. За допълнителна информация предлагаме да се обърнете към правилата и условията, както и към страниците за помощ и поддръжка, предоставени от издателя или рекламодателя. MetaversePost се ангажира с точно, безпристрастно отчитане, но пазарните условия подлежат на промяна без предизвестие.
За автора
Дамир е ръководител на екип, продуктов мениджър и редактор в Metaverse Post, обхващащи теми като AI/ML, AGI, LLMs, Metaverse и Web3- свързани полета. Статиите му привличат огромна аудитория от над милион потребители всеки месец. Изглежда, че е експерт с 10 години опит в SEO и дигитален маркетинг. Дамир е споменат в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и други публикации. Той пътува между ОАЕ, Турция, Русия и ОНД като дигитален номад. Дамир получава бакалавърска степен по физика, която според него му е дала уменията за критично мислене, необходими за успех в непрекъснато променящия се пейзаж на интернет.
Още статииДамир е ръководител на екип, продуктов мениджър и редактор в Metaverse Post, обхващащи теми като AI/ML, AGI, LLMs, Metaverse и Web3- свързани полета. Статиите му привличат огромна аудитория от над милион потребители всеки месец. Изглежда, че е експерт с 10 години опит в SEO и дигитален маркетинг. Дамир е споменат в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и други публикации. Той пътува между ОАЕ, Турция, Русия и ОНД като дигитален номад. Дамир получава бакалавърска степен по физика, която според него му е дала уменията за критично мислене, необходими за успех в непрекъснато променящия се пейзаж на интернет.