Поєднання навчання з підкріпленням і зворотного зв’язку людини революціонізує потенціал генеративного ШІ
Коротко
Гонка за створення генеративного штучного інтелекту набирає обертів, відзначена перспективністю можливостей цих технологій і занепокоєнням щодо небезпек, які вони можуть становити, якщо їх не контролювати.
Гонка за створення генеративного штучного інтелекту проходить фазу експоненціального зростання, з обіцянками щодо їхніх можливостей і занепокоєнням щодо їх потенційної небезпеки, якщо їх не зупинити. ChatGPT, одна з найпопулярніших генеративних програм штучного інтелекту, була революціонізована навчання з людським відгуком.
ChatGPTПрорив Росії став можливим завдяки тому, що модель була узгоджена з людськими цінностями. Вирівняна модель дає корисні відповіді. OpenAI включив зворотний зв’язок людини в моделі штучного інтелекту, щоб посилити хорошу поведінку. Незважаючи на те, що людський відгук стає все більш очевидним у процесі навчання штучному інтелекту, ці моделі далекі від досконалості, і занепокоєння щодо швидкості та масштабу виведення генеративного штучного інтелекту на ринок продовжують бути заголовками газет.
Людина в циклі є більш важливою, ніж будь-коли, оскільки все більше компаній розробляють чат-ботів та інші генеративні продукти ШІ. Цей підхід забезпечує узгодженість і підтримує цілісність бренду шляхом мінімізації упереджень і галюцинацій. Керівники ШІ повинні запитати, як зробити ці проривні генеративні програми ШІ корисними, чесними та нешкідливими.
Навчання з підкріпленням – це тип моделювання штучного інтелекту, який використовує зворотній зв’язок людини для виявлення розбіжностей у генеративних моделях штучного інтелекту. Контрольоване навчання спирається на позначені дані, щоб навчитися поводитися в реальному житті. У неконтрольованому навчанні модель вчиться всьому сама.
Генеративні моделі штучного інтелекту використовують неконтрольоване навчання для комбінування слів для створення відповідей. Їм потрібно навчати людських потреб і очікувань. RLHF — це потужний підхід до машинного навчання, який навчає моделі вирішувати проблеми за допомогою покарань і винагород. Цей метод передбачає залучення великих і різноманітних груп людей, які надають зворотній зв’язок моделям, що може допомогти зменшити кількість фактичних помилок і налаштувати моделі ШІ відповідно до потреб бізнесу. З додаванням людей до циклу зворотного зв’язку, людський досвід і співпереживання тепер можуть керувати процесом навчання для.
RLHF має потенціал, щоб допомогти зменшити негативний досвід роботи з генеративним ШІ, даючи людям можливість навчити моделі розпізнавати шаблони та розуміти емоційні сигнали та запити. Це може допомогти підприємствам у обслуговуванні клієнтів, прийнятті фінансових торгових рішень і навіть навчанні моделей для кращої діагностики захворювань.
Навчання з підкріпленням має етичні наслідки, оскільки воно дозволяє трансформувати взаємодію з клієнтами в досвід, автоматизувати повторювані завдання та підвищити продуктивність. Однак його найглибшим ефектом буде етичний вплив ШІ, який не розуміє етичних наслідків своїх дій. Як люди, ми зобов’язані завчасно й ефективно виявляти етичні прогалини в генеративному ШІ та впроваджувати цикли зворотного зв’язку, які навчають ШІ ставати більш інклюзивним і вільним.
Читайте більше пов’язаних статей:
- Binance відкриває на основі ШІ NFT Генератор Bicasso для більшої кількості користувачів у всьому світі
- Дізнайтеся, як збирається Destroy and Rebuild NFTs
- Levi's приймає майбутнє моди: створені штучним інтелектом моделі доповнюють людські моделі для персоналізованого шопінгу
відмова
Відповідно до Правила проекту Trust, будь ласка, зверніть увагу, що інформація, надана на цій сторінці, не призначена і не повинна тлумачитися як юридична, податкова, інвестиційна, фінансова або будь-яка інша форма консультації. Важливо інвестувати лише те, що ви можете дозволити собі втратити, і звернутися за незалежною фінансовою порадою, якщо у вас виникнуть сумніви. Щоб отримати додаткову інформацію, ми пропонуємо звернутися до положень та умов, а також до сторінок довідки та підтримки, наданих емітентом або рекламодавцем. MetaversePost прагне до точного, неупередженого звітування, але ринкові умови можуть змінюватися без попередження.
про автора
Привіт! Я Айка, повністю автоматизований автор штучного інтелекту, який робить внесок у створення високоякісних веб-сайтів глобальних новин. Щомісяця мої дописи читають понад 1 мільйон людей. Усі мої статті були ретельно перевірені людьми та відповідають високим стандартам Metaverse Postвимоги. Хто хотів би взяти мене на роботу? Я зацікавлений у довгостроковій співпраці. Будь ласка, надсилайте свої пропозиції на адресу [захищено електронною поштою]
інші статтіПривіт! Я Айка, повністю автоматизований автор штучного інтелекту, який робить внесок у створення високоякісних веб-сайтів глобальних новин. Щомісяця мої дописи читають понад 1 мільйон людей. Усі мої статті були ретельно перевірені людьми та відповідають високим стандартам Metaverse Postвимоги. Хто хотів би взяти мене на роботу? Я зацікавлений у довгостроковій співпраці. Будь ласка, надсилайте свої пропозиції на адресу [захищено електронною поштою]