Новостной репортаж Технологии
Июль 18, 2023

Meta представляет революционный открытый исходный код LLaMa-2-Чат с беспрецедентной производительностью

Коротко

Мета выпустила LLaMaМодели -2-Chat — крупный прорыв в области искусственного интеллекта с открытым исходным кодом.

Эти модели с параметрами 70В сопоставимы с GPT-3.5 и превосходят контрольные показатели.

Точно настроенные с помощью RLHF, они предлагают персонализированные ChatGPT эквиваленты, показатели человеческой оценки и возможности решения математических задач.

Мета недавно выпустил набор LLaMa-2-чат модели различных размеров. Этот выпуск от отдела LLM GenAI вызвал ажиотаж в отрасли.

Meta представляет революционный открытый исходный код LLaMa-2-Чат с беспрецедентной производительностью
Кредит: Metaverse Post (mpost.ио)

LLaMa-2-Chat — это поистине выдающееся достижение, созданное талантливой командой отдела LLM GenAI. Обладая впечатляющим числом параметров в 70 миллиардов, эта модель сравнима и даже превосходит высоко оцененные GPT-3.5 на определенных ориентирах.

Особенности:

  • Коммерческий дружественный
  • Предварительно обучен на токенах 2T
  • Сильные оценки MMLU (т.е. сильные аргументы)
  • Контекст 4K
  • (Расширяемые) вставки RoPE
  • Производительность кодирования выше всяких похвал.
  • Версии чата SFT/RLHF

Дело в том, что LLaMa-2-Chat — первая модель такого размера, которая была настроена с использованием RLHF (обучение с подкреплением на основе обратной связи между людьми), что делает ее еще более замечательной. Meta сделала беспрецедентный шаг, сделав эту модель полностью бесплатной для коммерческого использования. Желающие могут запросить ссылку для скачивания на их официальном сайте.

Одно из самых значительных преимуществ LLaMa-2-Чат – это его потенциал для создания ChatGPT аналоги без необходимости делиться какими-либо данными с OpenAI. Это позволяет разработчикам и исследователям использовать возможности модели, сохраняя при этом полный контроль над своими данными. Ты можешь скачать новая модель здесь.

Что касается показателей человеческой оценки, LLaMa-2-Чат стоит плечом к плечу с ChatGPT-3.5 по качеству. Примечательно, что он демонстрирует исключительную производительность при решении математических задач, превосходя другие модели в этой области.

  • В феврале Мета выпустила LLaMA модель, большая языковая модель, предназначенная для поддержки исследователей ИИ. Доступны в различных размерах (параметры 7B, 13B, 33B и 65B), LLaMA позволяет исследователи тестируют новые подходы и изучить новые варианты использования. Модель идеальна для задач тонкой настройки и построена на большом наборе неразмеченных данных. Несмотря на свою универсальность, LLaMA сталкивается с риском предвзятости, токсичных комментариев и галлюцинаций. Модель выпускается под некоммерческой лицензией, ориентированной на случаи использования в исследованиях, а право на доступ оценивается в каждом конкретном случае.
  • Ассоциация LLaMa модель с 7 миллиардами параметров, добился молниеносного логического вывода на MacBook с чипом M2 Max. Это достижение стало возможным благодаря успешной реализации Грегановым вывода моделей на Metal GPU, специализированном ускорителе, который присутствует в новейших чипах Apple. LLaMa Модель демонстрирует 0% загрузку ЦП, используя вычислительную мощность всех 38 ядер Metal. Такое видение персонализированной помощи ИИ и локализации на персональных устройствах таит в себе огромный потенциал для будущего, в котором ИИ станет неотъемлемой частью жизни людей, предоставляя персонализированную помощь и оптимизируя рутинные задачи.

Подробнее об ИИ:

Отказ от ответственности

В соответствии с Руководство трастового проектаОбратите внимание, что информация, представленная на этой странице, не предназначена и не должна интерпретироваться как юридическая, налоговая, инвестиционная, финансовая или любая другая форма консультации. Важно инвестировать только то, что вы можете позволить себе потерять, и обращаться за независимой финансовой консультацией, если у вас есть какие-либо сомнения. Для получения дополнительной информации мы предлагаем обратиться к положениям и условиям, а также к страницам справки и поддержки, предоставленным эмитентом или рекламодателем. MetaversePost стремится предоставлять точную и объективную отчетность, однако рыночные условия могут быть изменены без предварительного уведомления.

Об авторе

Дамир — руководитель группы, менеджер по продукту и редактор в Metaverse Post, охватывающие такие темы, как AI/ML, AGI, LLM, Metaverse и Web3-связанные поля. Его статьи ежемесячно привлекают огромную аудиторию, насчитывающую более миллиона пользователей. Похоже, он эксперт с 10-летним опытом работы в области SEO и цифрового маркетинга. Дамир упоминается в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и другие издания. Он путешествует между ОАЭ, Турцией, Россией и СНГ в качестве цифрового кочевника. Дамир получил степень бакалавра в области физики, что, по его мнению, дало ему навыки критического мышления, необходимые для достижения успеха в постоянно меняющемся мире Интернета. 

Другие статьи
Дамир Ялалов
Дамир Ялалов

Дамир — руководитель группы, менеджер по продукту и редактор в Metaverse Post, охватывающие такие темы, как AI/ML, AGI, LLM, Metaverse и Web3-связанные поля. Его статьи ежемесячно привлекают огромную аудиторию, насчитывающую более миллиона пользователей. Похоже, он эксперт с 10-летним опытом работы в области SEO и цифрового маркетинга. Дамир упоминается в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и другие издания. Он путешествует между ОАЭ, Турцией, Россией и СНГ в качестве цифрового кочевника. Дамир получил степень бакалавра в области физики, что, по его мнению, дало ему навыки критического мышления, необходимые для достижения успеха в постоянно меняющемся мире Интернета. 

Hot Stories
Подпишитесь на нашу рассылку.
Новости

Институциональный аппетит к биткойн-ETF растет на фоне волатильности

Раскрытие информации через отчеты 13F показывает, что известные институциональные инвесторы балуются биткойн-ETF, подчеркивая растущее признание...

Узнать больше

Наступил день вынесения приговора: судьба CZ висит на волоске, поскольку суд США рассматривает ходатайство Министерства юстиции

Чанпэн Чжао сегодня предстанет перед судом США в Сиэтле.

Узнать больше
Присоединяйтесь к нашему сообществу инновационных технологий
Узнать больше
Читать далее
zkSync представит P256Verify, Bridgehub и Valdiums, поддерживающие расширенные функции в следующем обновлении
Новостной репортаж Технологии
zkSync представит P256Verify, Bridgehub и Valdiums, поддерживающие расширенные функции в следующем обновлении
8 мая 2024
LD Capital, Antalpha Ventures и Highblock Limited объединяют усилия для запуска гонконгского фонда ликвидности ETF стоимостью $128 млн.
Бизнес Области применения: Новостной репортаж
LD Capital, Antalpha Ventures и Highblock Limited объединяют усилия для запуска гонконгского фонда ликвидности ETF стоимостью $128 млн.
8 мая 2024
Мемы изнутри Уолл-стрит (WSM): заголовки новостей
Бизнес Области применения: Истории и обзоры Технологии
Мемы изнутри Уолл-стрит (WSM): заголовки новостей
7 мая 2024
Откройте для себя криптокитов: кто есть кто на рынке
Бизнес Области применения: Истории и обзоры Технологии
Откройте для себя криптокитов: кто есть кто на рынке
7 мая 2024
CRYPTOMERIA LABS PTE. ООО