Исследователи MIT и Google представляют StableRep, модель искусственного интеллекта для улучшения производства изображений
Коротко
Ученые из Массачусетского технологического института и Google представили StableRep, модель искусственного интеллекта, которая преобразует текстовые подсказки в точные изображения с помощью Stable Diffusion.
MIT и Google Ученые-компьютерщики представили StableRep, ИИ-модель, предназначенную для преобразования описательных письменных подписей в точные соответствующие изображения с использованием изображений, созданных Stable Diffusion. Этот инструмент направлен на расширение возможностей нейронных сетей генерировать изображения на основе текстовых описаний.
По мнению исследователей, синтетические изображения могут помочь моделям ИИ более точно изучать визуальные представления по сравнению с реальными фотографиями.
Целью StableRep является предоставление исследователям возможности управлять алгоритмическим процессом машинного обучения путем обучения модели на множестве изображений, сгенерированных Stable Diffusion в ответ на ту же подсказку. Таким образом, модель научится более широкому спектру визуальных представлений, defiопределить, какие изображения точно соответствуют заданным подсказкам.
Исследователи предполагают появление экосистемы моделей ИИ, некоторые из которых будут обучаться на реальных или синтетических данных. В настоящее время усилия сосредоточены на том, чтобы научить модель узнавать больше о концепциях высокого уровня посредством контекстуального понимания и изменчивости, а не просто снабжать ее данными.
StableRep поможет разработчикам и движкам искусственного интеллекта
В основе модели преобразования текста в изображение заключается в их способности связывать предметы со словами. При появлении текстового приглашения эти модели должны генерировать изображение, максимально соответствующее предоставленному описанию. Чтобы достичь этого, они должны получить представление о визуальном представлении объектов реального мира.
Согласно недавнему предварительная печать бумаги на arXivStableRep превосходит SimCLR и CLIP с точки зрения изученных представлений, используя один и тот же набор текстовых подсказок и соответствующие реальные изображения в крупномасштабных наборах данных, полагаясь исключительно на синтетические изображения.
В документе продолжается: «Когда мы в дальнейшем введем языковой контроль, StableRep, обученный на 20 миллионах синтетических изображений, достигнет большей точности, чем CLIP, обученный на 50 миллионах реальных изображений».
SimCLR и CLIP — это алгоритмы машинного обучения, используемые для создания изображений из текстовых подсказок.
Этот инновационный подход позволяет разработчикам ИИ обучать нейронные сети с использованием меньшего количества синтетических изображений, чем реальных, и при этом достигать лучших результатов. Появление методов, подобных StableRep, предполагает будущее, в котором модели преобразования текста в изображение можно будет обучать преимущественно на синтетических данных, что снижает зависимость от реальных изображений и поддерживает механизмы искусственного интеллекта, когда они сталкиваются с ограничениями доступных онлайн-ресурсов.
Отказ от ответственности
В соответствии с Руководство трастового проектаОбратите внимание, что информация, представленная на этой странице, не предназначена и не должна интерпретироваться как юридическая, налоговая, инвестиционная, финансовая или любая другая форма консультации. Важно инвестировать только то, что вы можете позволить себе потерять, и обращаться за независимой финансовой консультацией, если у вас есть какие-либо сомнения. Для получения дополнительной информации мы предлагаем обратиться к положениям и условиям, а также к страницам справки и поддержки, предоставленным эмитентом или рекламодателем. MetaversePost стремится предоставлять точную и объективную отчетность, однако рыночные условия могут быть изменены без предварительного уведомления.
Об авторе
Алиса, преданный журналист MPost, специализируется на криптовалюте, доказательствах с нулевым разглашением, инвестициях и обширной сфере Web3. Внимательно следя за новыми тенденциями и технологиями, она всесторонне освещает события, информируя и вовлекая читателей в постоянно развивающуюся среду цифровых финансов.
Другие статьиАлиса, преданный журналист MPost, специализируется на криптовалюте, доказательствах с нулевым разглашением, инвестициях и обширной сфере Web3. Внимательно следя за новыми тенденциями и технологиями, она всесторонне освещает события, информируя и вовлекая читателей в постоянно развивающуюся среду цифровых финансов.