Databricks публікує Dolly 2.0, перший комерційно доступний 12B Chat-LLM з відкритим кодом
Коротко
Databricks оголосила про запуск Dolly 2.0 як першого комерційно доступного 12B Chat-LLM з відкритим вихідним кодом, що дозволяє компаніям створювати потужні мовні моделі без інвестицій у дорогі кластери GPU.
Databricks має оголошений запуск Dolly 2.0 як першого комерційно доступного 12B Chat-LLM з відкритим кодом. Dolly є великим проривом для індустрії машинного навчання, що дозволяє компаніям створювати потужні мовні моделі, такі як авторегресійні LLM із підтримкою діалогу, без необхідності інвестувати у дорогі кластери GPU.
Щоб отримати модель мови з відкритим вихідним кодом, Databricks потрібен був великий набір даних високої якості. Після початкового розгляду альпаки GPT-3 набору даних та інших наборів даних із відкритим кодом, які не допускають комерційного використання, вони вирішили створити власний високоякісний набір даних. Для цього вони найняли 5,000 людей і попросили їх написати кілька прикладів, які б використовувалися для навчання авторегресійного LLM, здатного просто продовжувати текст, а не вести діалог. Завдяки чудовим заохоченням, таким як бонуси за написання найкращих прикладів, вони змогли зібрати вражаючу 15,000 XNUMX вибіркових даних.
Databricks зробили наступний крок і включили EleutherAI Піфія-12Б мовну модель з ліцензією Массачусетського технологічного інституту та перенавчили її на власному наборі даних, у результаті чого виникла Dolly 2.0. Dolly 2.0 було випущено за ліцензією MIT разом із супровідним кодом. Із запуском Dolly 2.0 галузь машинного навчання тепер має потужний інструмент для створення надійних мовних моделей економічно ефективним способом. Це можуть використовувати як компанії, так і окремі особи, які хочуть створювати потужні програми, здатні розуміти та обробляти складну мову.
Загалом, запуск Доллі 2.0 як перший комерційно доступний 12B Chat-LLM з відкритим кодом є важливою віхою для галузі машинного навчання. Скориставшись перевагами ліцензії Массачусетського технологічного інституту та створивши власний високоякісний набір даних, Databricks зробила потужні мовні моделі доступними як для компаній, так і для окремих осіб. Dolly 2.0 зробить революцію в галузі та є великим кроком вперед у машинному навчанні.
Тепер користувачі чекають, поки розробники квантують Dolly у 4 біти та пришвидшать її для роботи на ЦП, а також очікують відповіді від OpenAssistant, який, як очікується, надасть свою модель протягом наступних кількох днів.
- NTIA просить публічних коментарів щодо можливих правил, які регулюють системи штучного інтелекту як ChatGPT щоб допомогти адміністрації Байдена переконатися, що вони функціонують, як обіцяно. NTIA оприлюднило заяву щодо створення правил підзвітності AI, які можуть запобігти майбутнім нещасним випадкам і мінімізувати ризики від гіпотетичних загроз.
Докладніше про ШІ:
відмова
Відповідно до Правила проекту Trust, будь ласка, зверніть увагу, що інформація, надана на цій сторінці, не призначена і не повинна тлумачитися як юридична, податкова, інвестиційна, фінансова або будь-яка інша форма консультації. Важливо інвестувати лише те, що ви можете дозволити собі втратити, і звернутися за незалежною фінансовою порадою, якщо у вас виникнуть сумніви. Щоб отримати додаткову інформацію, ми пропонуємо звернутися до положень та умов, а також до сторінок довідки та підтримки, наданих емітентом або рекламодавцем. MetaversePost прагне до точного, неупередженого звітування, але ринкові умови можуть змінюватися без попередження.
про автора
Дамір є керівником групи, менеджером із продуктів і редактором Metaverse Post, що охоплює такі теми, як AI/ML, AGI, LLMs, Metaverse тощо Web3- суміжні поля. Його статті щомісяця приваблюють величезну аудиторію понад мільйон користувачів. Здається, він є експертом із 10-річним досвідом роботи в SEO та цифровому маркетингу. Даміра згадували в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto та інші видання. Він подорожує між ОАЕ, Туреччиною, Росією та СНД як цифровий кочівник. Дамір отримав ступінь бакалавра з фізики, що, на його думку, дало йому навички критичного мислення, необхідні для досягнення успіху в Інтернеті, який постійно змінюється.
інші статтіДамір є керівником групи, менеджером із продуктів і редактором Metaverse Post, що охоплює такі теми, як AI/ML, AGI, LLMs, Metaverse тощо Web3- суміжні поля. Його статті щомісяця приваблюють величезну аудиторію понад мільйон користувачів. Здається, він є експертом із 10-річним досвідом роботи в SEO та цифровому маркетингу. Даміра згадували в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto та інші видання. Він подорожує між ОАЕ, Туреччиною, Росією та СНД як цифровий кочівник. Дамір отримав ступінь бакалавра з фізики, що, на його думку, дало йому навички критичного мислення, необхідні для досягнення успіху в Інтернеті, який постійно змінюється.