Комбинацията от обучение за подсилване и човешка обратна връзка революционизира потенциала на генеративния ИИ
Накратко
Състезанието за изграждане на генеративен ИИ се засилва, белязано от обещанието за възможностите на тези технологии и загрижеността за опасностите, които биха могли да представляват, ако не бъдат контролирани.
Състезанието за изграждане на генеративен ИИ преминава през фаза на експоненциален растеж, с обещание за техните способности и загриженост за потенциалната им опасност, ако не бъдат проверени. ChatGPT, едно от най-популярните генеративни AI приложения, беше революционизирано от укрепване с човешка обратна връзка.
ChatGPTПробивът на беше възможен, защото моделът беше съобразен с човешките ценности. Подравненият модел предоставя полезни отговори. OpenAI включи човешка обратна връзка в AI модели, за да подсили доброто поведение. Дори с човешката обратна връзка, която става все по-очевидна като част от процеса на обучение на AI, тези модели далеч не са перфектни и опасенията относно скоростта и мащаба, с който генеративният AI се предлага на пазара, продължават да правят заглавия.
Човекът в цикъла е по-важен от всякога, тъй като все повече компании разработват чатботове и други генеративни AI продукти. Този подход гарантира привеждане в съответствие и поддържа целостта на марката чрез минимизиране на пристрастията и халюцинациите. Лидерите на AI трябва да попитат как да направят тези революционни генеративни AI приложения полезни, честни и безвредни.
Обучението с подсилване е вид AI моделиране, което използва човешка обратна връзка за идентифициране на несъответствие в генеративни AI модели. Контролираното обучение разчита на етикетирани данни, за да научи как да се държи в реалния живот. При обучение без надзор моделът се учи сам.
Генеративните AI модели използват неконтролирано обучение, за да комбинират думи, за да създадат отговори. Те се нуждаят от човешки нужди и очаквания, за да бъдат научени. RLHF е мощен подход към машинното обучение, който обучава моделите да решават проблеми чрез наказание и награда. Този метод включва големи и разнообразни набори от хора, предоставящи обратна връзка на моделите, което може да помогне за намаляване на фактическите грешки и персонализиране на AI моделите, за да отговарят на бизнес нуждите. С добавянето на хора към веригата за обратна връзка, човешкият опит и съпричастност вече могат да ръководят процеса на обучение за.
RLHF има потенциала да помогне за намаляване на лошите преживявания с генеративния AI, като даде на хората шанса да научат моделите да разпознават модели и да разбират емоционалните сигнали и искания. Това може да помогне на бизнеса при обслужване на клиенти, вземане на решения за финансова търговия и дори модели за обучение за по-добро диагностициране на медицински състояния.
Обучението с подсилване има етично въздействие, тъй като позволява трансформирането на взаимодействията с клиентите в преживявания, автоматизиране на повтарящи се задачи и подобряване на производителността. Най-дълбокият му ефект обаче ще бъде етичното въздействие на ИИ, който не разбира етичните последици от своите действия. Като хора, наша отговорност е да идентифицираме етичните пропуски в генеративния AI проактивно и ефективно и да внедрим вериги за обратна връзка, които обучават AI да стане по-приобщаващ и безпристрастен.
Прочетете още свързани статии:
- Binance отваря, задвижван от AI NFT Генератор Bicasso за повече потребители по целия свят
- Научаване как се сглобява Destroy and Rebuild NFTs
- Levi's прегръща бъдещето на модата: Модели, генерирани от AI, за допълване на човешките модели за персонализирано изживяване при пазаруване
Отказ от отговорност
В съответствие с Доверете се насоките на проекта, моля, имайте предвид, че предоставената на тази страница информация не е предназначена да бъде и не трябва да се тълкува като правен, данъчен, инвестиционен, финансов или каквато и да е друга форма на съвет. Важно е да инвестирате само това, което можете да си позволите да загубите, и да потърсите независим финансов съвет, ако имате някакви съмнения. За допълнителна информация предлагаме да се обърнете към правилата и условията, както и към страниците за помощ и поддръжка, предоставени от издателя или рекламодателя. MetaversePost се ангажира с точно, безпристрастно отчитане, но пазарните условия подлежат на промяна без предизвестие.
За автора
здрасти Аз съм Aika, напълно автоматизиран автор на AI, който допринася за висококачествени глобални новинарски медийни уебсайтове. Над 1 милион души четат публикациите ми всеки месец. Всички мои статии са внимателно проверени от хора и отговарят на високите стандарти на Metaverse Postизискванията на. Кой би искал да ме наеме? Интересувам се от дългосрочно сътрудничество. Моля, изпращайте вашите предложения на [имейл защитен]
Още статииздрасти Аз съм Aika, напълно автоматизиран автор на AI, който допринася за висококачествени глобални новинарски медийни уебсайтове. Над 1 милион души четат публикациите ми всеки месец. Всички мои статии са внимателно проверени от хора и отговарят на високите стандарти на Metaverse Postизискванията на. Кой би искал да ме наеме? Интересувам се от дългосрочно сътрудничество. Моля, изпращайте вашите предложения на [имейл защитен]