Новостной репортаж Технологии
22 ноября 2023

Исследователи MIT и Google представляют StableRep, модель искусственного интеллекта для улучшения производства изображений

Коротко

Ученые из Массачусетского технологического института и Google представили StableRep, модель искусственного интеллекта, которая преобразует текстовые подсказки в точные изображения с помощью Stable Diffusion.

Исследователи MIT и Google представляют программу искусственного интеллекта, улучшающую создание изображений с помощью подсказок

MIT и Google Ученые-компьютерщики представили StableRep, ИИ-модель, предназначенную для преобразования описательных письменных подписей в точные соответствующие изображения с использованием изображений, созданных Stable Diffusion. Этот инструмент направлен на расширение возможностей нейронных сетей генерировать изображения на основе текстовых описаний.

По мнению исследователей, синтетические изображения могут помочь моделям ИИ более точно изучать визуальные представления по сравнению с реальными фотографиями.

Целью StableRep является предоставление исследователям возможности управлять алгоритмическим процессом машинного обучения путем обучения модели на множестве изображений, сгенерированных Stable Diffusion в ответ на ту же подсказку. Таким образом, модель научится более широкому спектру визуальных представлений, defiопределить, какие изображения точно соответствуют заданным подсказкам.

Исследователи предполагают появление экосистемы моделей ИИ, некоторые из которых будут обучаться на реальных или синтетических данных. В настоящее время усилия сосредоточены на том, чтобы научить модель узнавать больше о концепциях высокого уровня посредством контекстуального понимания и изменчивости, а не просто снабжать ее данными.

StableRep поможет разработчикам и движкам искусственного интеллекта 

В основе модели преобразования текста в изображение заключается в их способности связывать предметы со словами. При появлении текстового приглашения эти модели должны генерировать изображение, максимально соответствующее предоставленному описанию. Чтобы достичь этого, они должны получить представление о визуальном представлении объектов реального мира.

Согласно недавнему предварительная печать бумаги на arXivStableRep превосходит SimCLR и CLIP с точки зрения изученных представлений, используя один и тот же набор текстовых подсказок и соответствующие реальные изображения в крупномасштабных наборах данных, полагаясь исключительно на синтетические изображения. 

В документе продолжается: «Когда мы в дальнейшем введем языковой контроль, StableRep, обученный на 20 миллионах синтетических изображений, достигнет большей точности, чем CLIP, обученный на 50 миллионах реальных изображений».

SimCLR и CLIP — это алгоритмы машинного обучения, используемые для создания изображений из текстовых подсказок.

Этот инновационный подход позволяет разработчикам ИИ обучать нейронные сети с использованием меньшего количества синтетических изображений, чем реальных, и при этом достигать лучших результатов. Появление методов, подобных StableRep, предполагает будущее, в котором модели преобразования текста в изображение можно будет обучать преимущественно на синтетических данных, что снижает зависимость от реальных изображений и поддерживает механизмы искусственного интеллекта, когда они сталкиваются с ограничениями доступных онлайн-ресурсов.

Отказ от ответственности

В соответствии с Руководство трастового проектаОбратите внимание, что информация, представленная на этой странице, не предназначена и не должна интерпретироваться как юридическая, налоговая, инвестиционная, финансовая или любая другая форма консультации. Важно инвестировать только то, что вы можете позволить себе потерять, и обращаться за независимой финансовой консультацией, если у вас есть какие-либо сомнения. Для получения дополнительной информации мы предлагаем обратиться к положениям и условиям, а также к страницам справки и поддержки, предоставленным эмитентом или рекламодателем. MetaversePost стремится предоставлять точную и объективную отчетность, однако рыночные условия могут быть изменены без предварительного уведомления.

Об авторе

Алиса, преданный журналист MPost, специализируется на криптовалюте, доказательствах с нулевым разглашением, инвестициях и обширной сфере Web3. Внимательно следя за новыми тенденциями и технологиями, она всесторонне освещает события, информируя и вовлекая читателей в постоянно развивающуюся среду цифровых финансов.

Другие статьи
Алиса Дэвидсон
Алиса Дэвидсон

Алиса, преданный журналист MPost, специализируется на криптовалюте, доказательствах с нулевым разглашением, инвестициях и обширной сфере Web3. Внимательно следя за новыми тенденциями и технологиями, она всесторонне освещает события, информируя и вовлекая читателей в постоянно развивающуюся среду цифровых финансов.

Hot Stories
Подпишитесь на нашу рассылку.
Новости

Институциональный аппетит к биткойн-ETF растет на фоне волатильности

Раскрытие информации через отчеты 13F показывает, что известные институциональные инвесторы балуются биткойн-ETF, подчеркивая растущее признание...

Узнать больше

Наступил день вынесения приговора: судьба CZ висит на волоске, поскольку суд США рассматривает ходатайство Министерства юстиции

Чанпэн Чжао сегодня предстанет перед судом США в Сиэтле.

Узнать больше
Присоединяйтесь к нашему сообществу инновационных технологий
Узнать больше
Читать далее
Nexo начинает «охоту», чтобы вознаградить пользователей токенами NEXO на сумму 12 миллионов долларов за взаимодействие с ее экосистемой
Области применения: Новостной репортаж Технологии
Nexo начинает «охоту», чтобы вознаградить пользователей токенами NEXO на сумму 12 миллионов долларов за взаимодействие с ее экосистемой
8 мая 2024
Биржа Revolut X Revolut привлекает криптотрейдеров нулевой комиссией производителя и расширенной аналитикой
Области применения: Software Истории и обзоры Технологии
Биржа Revolut X Revolut привлекает криптотрейдеров нулевой комиссией производителя и расширенной аналитикой
8 мая 2024
Криптовалютная торговая платформа BitMEX представляет торговлю опционами с нулевой комиссией и денежными стимулами
Бизнес Области применения: Новостной репортаж
Криптовалютная торговая платформа BitMEX представляет торговлю опционами с нулевой комиссией и денежными стимулами
8 мая 2024
Lisk официально переходит на Ethereum Layer 2 и представляет ядро ​​v4.0.6
Новостной репортаж Технологии
Lisk официально переходит на Ethereum Layer 2 и представляет ядро ​​v4.0.6
8 мая 2024
CRYPTOMERIA LABS PTE. ООО