Новостной репортаж СМЗ Технологии
31 мая 2023

Деменция ИИ: проблемы контента, созданного моделями, и его влияние на системы ИИ

Коротко

Исследователи обнаружили явление модельного слабоумия, которое относится к необратимым дефектам, возникающим в моделях, когда исчезают хвосты исходного распределения контента.

Чтобы сохранить преимущества обучающих моделей на интернет-данных, необходимо найти решения, которые уменьшат потенциальную потерю распространения исходного контента.

Быстрое развитие технологий искусственного интеллекта привело к невероятным достижениям в области обработки естественного языка и генерации изображений. Большие языковые модели (LLM), такие как GPT-2, GPT-3 (.5) и GPT-4 продемонстрировали замечательную производительность при выполнении различных языковых задач, а такие модели, как ChatGPT представили эти языковые возможности широкой публике. Однако по мере того, как LLM становятся все более распространенными и вносят значительный вклад в язык, который можно найти в Интернете, исследователи обнаружили проблему, известную как «модель слабоумия".

Деменция ИИ: проблемы контента, созданного моделями, и его влияние на системы ИИ
Metaverse Post (mpost.ио)
Рекомендуется: OpenAI: ИИ потенциально может причинить много вреда людям, но пытаться остановить прогресс — не вариант

В недавней статье исследователи пролили свет на феномен модельной деменции, который относится к необратимым дефектам, возникающим в моделях, когда исчезают хвосты исходного распределения контента. Исследование показывает, что использование контента, сгенерированного моделью, во время обучения может привести к такому результату. когнитивное снижение в полученных моделях. Этот эффект наблюдался в вариационных автоэнкодерах (VAE), моделях гауссовой смеси (GMM) и LLM. Результаты подчеркивают необходимость решения этой проблемы, чтобы сохранить преимущества обучающие модели на крупномасштабных данных, полученных из Интернета.

arxiv.org/pdf/2305.17493.pdf

Исследователи обеспечивают теоретическое понимание модельной деменции и демонстрируют ее распространенность в различных генеративные модели. Они утверждают, что к этому явлению следует относиться серьезно, чтобы обеспечить постоянную эффективность моделей обучения на обширных объектах. веб-данные. Поскольку LLM все больше вносят свой вклад в язык и контент, доступные в Интернете, ценность данных собранные из реальных человеческих взаимодействий с системами становится еще более важным.

Вступление к stable diffusion, техника, которая произвела революцию в создании изображений из описание, еще раз иллюстрирует влияние LLM на создание контента. Однако исследование предполагает, что использование контента, сгенерированного моделью, может привести к потере конечного распределения контента, что может подорвать разнообразие и богатство исходных данных.

В то время как крупномасштабные данные, извлеченные из Интернета, дают ценную информацию о взаимодействии человека с системами, наличие контент, созданный LLM, ставит новые задачи. Исследователи подчеркивают необходимость решения проблемы модельного слабоумия и поиска решений, которые сохранят преимущества обучения моделей на данных из Интернета, одновременно уменьшая потенциальную потерю распространения исходного контента.

Поскольку область ИИ продолжает развиваться, исследователям, разработчикам и политикам крайне важно знать об ограничениях и проблемах, связанных с моделями обучения на контенте, созданном с помощью моделей. Понимая и решая такие проблемы, как модельное слабоумие, мы можем обеспечить ответственное и эффективное использование технологии ИИ в будущем.

Подробнее об ИИ:

Отказ от ответственности

В соответствии с Руководство трастового проектаОбратите внимание, что информация, представленная на этой странице, не предназначена и не должна интерпретироваться как юридическая, налоговая, инвестиционная, финансовая или любая другая форма консультации. Важно инвестировать только то, что вы можете позволить себе потерять, и обращаться за независимой финансовой консультацией, если у вас есть какие-либо сомнения. Для получения дополнительной информации мы предлагаем обратиться к положениям и условиям, а также к страницам справки и поддержки, предоставленным эмитентом или рекламодателем. MetaversePost стремится предоставлять точную и объективную отчетность, однако рыночные условия могут быть изменены без предварительного уведомления.

Об авторе

Дамир — руководитель группы, менеджер по продукту и редактор в Metaverse Post, охватывающие такие темы, как AI/ML, AGI, LLM, Metaverse и Web3-связанные поля. Его статьи ежемесячно привлекают огромную аудиторию, насчитывающую более миллиона пользователей. Похоже, он эксперт с 10-летним опытом работы в области SEO и цифрового маркетинга. Дамир упоминается в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и другие издания. Он путешествует между ОАЭ, Турцией, Россией и СНГ в качестве цифрового кочевника. Дамир получил степень бакалавра в области физики, что, по его мнению, дало ему навыки критического мышления, необходимые для достижения успеха в постоянно меняющемся мире Интернета. 

Другие статьи
Дамир Ялалов
Дамир Ялалов

Дамир — руководитель группы, менеджер по продукту и редактор в Metaverse Post, охватывающие такие темы, как AI/ML, AGI, LLM, Metaverse и Web3-связанные поля. Его статьи ежемесячно привлекают огромную аудиторию, насчитывающую более миллиона пользователей. Похоже, он эксперт с 10-летним опытом работы в области SEO и цифрового маркетинга. Дамир упоминается в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и другие издания. Он путешествует между ОАЭ, Турцией, Россией и СНГ в качестве цифрового кочевника. Дамир получил степень бакалавра в области физики, что, по его мнению, дало ему навыки критического мышления, необходимые для достижения успеха в постоянно меняющемся мире Интернета. 

Hot Stories
Подпишитесь на нашу рассылку.
Новости

Институциональный аппетит к биткойн-ETF растет на фоне волатильности

Раскрытие информации через отчеты 13F показывает, что известные институциональные инвесторы балуются биткойн-ETF, подчеркивая растущее признание...

Узнать больше

Наступил день вынесения приговора: судьба CZ висит на волоске, поскольку суд США рассматривает ходатайство Министерства юстиции

Чанпэн Чжао сегодня предстанет перед судом США в Сиэтле.

Узнать больше
Присоединяйтесь к нашему сообществу инновационных технологий
Узнать больше
Читать далее
Nexo начинает «охоту», чтобы вознаградить пользователей токенами NEXO на сумму 12 миллионов долларов за взаимодействие с ее экосистемой
Области применения: Новостной репортаж Технологии
Nexo начинает «охоту», чтобы вознаградить пользователей токенами NEXO на сумму 12 миллионов долларов за взаимодействие с ее экосистемой
8 мая 2024
Биржа Revolut X Revolut привлекает криптотрейдеров нулевой комиссией производителя и расширенной аналитикой
Области применения: Software Истории и обзоры Технологии
Биржа Revolut X Revolut привлекает криптотрейдеров нулевой комиссией производителя и расширенной аналитикой
8 мая 2024
Криптовалютная торговая платформа BitMEX представляет торговлю опционами с нулевой комиссией и денежными стимулами
Бизнес Области применения: Новостной репортаж
Криптовалютная торговая платформа BitMEX представляет торговлю опционами с нулевой комиссией и денежными стимулами
8 мая 2024
Lisk официально переходит на Ethereum Layer 2 и представляет ядро ​​v4.0.6
Новостной репортаж Технологии
Lisk официально переходит на Ethereum Layer 2 и представляет ядро ​​v4.0.6
8 мая 2024
CRYPTOMERIA LABS PTE. ООО