Звіт про новини Технологія
Листопад 22, 2023

Дослідники Массачусетського технологічного інституту та Google представляють StableRep, модель ШІ для покращення виробництва зображень

Коротко

Комп’ютерні вчені Массачусетського технологічного інституту та Google представили StableRep, модель ШІ, яка перетворює текстові підказки на точні зображення за допомогою Stable Diffusion.

Дослідники Массачусетського технологічного інституту та Google представили програму штучного інтелекту, яка покращує створення зображень із підказок

MIT та Google комп’ютерні вчені представили StableRep, модель штучного інтелекту, призначену для перетворення описових підписів у точні відповідні зображення за допомогою зображень, створених Stable Diffusion. Цей інструмент спрямований на розширення можливостей нейронних мереж генерувати зображення на основі текстових описів.

На думку дослідників, синтетичні зображення можуть допомогти моделям штучного інтелекту точніше вивчати візуальні зображення порівняно з реальними фотографіями.

StableRep має на меті надати дослідникам можливість керувати алгоритмічним процесом машинного навчання шляхом навчання моделі на безлічі зображень, створених Stable Diffusion у відповідь на той самий запит. Таким чином, модель вивчатиме ширший діапазон візуальних уявлень, defiВизначаючи, які зображення точно відповідають поданим підказкам.

Дослідники передбачають появу екосистеми моделей ШІ, деякі з яких навчатимуться на реальних або синтетичних даних. Зараз зусилля зосереджені на тому, щоб навчити модель дізнаватися більше про концепції високого рівня через контекстне розуміння та варіативність, замість того, щоб просто подавати їй дані.

StableRep допоможе розробникам штучного інтелекту та двигунам 

В основі моделі перетворення тексту в зображення полягає в їхній здатності зв’язувати предмети зі словами. При поданні запиту на введення тексту ці моделі мають створити зображення, яке точно відповідає наданому опису. Щоб досягти цього, вони повинні набути розуміння візуальних зображень об’єктів реального світу.

Відповідно до недавнього папір для попереднього друку на arXiv, StableRep перевершує SimCLR і CLIP з точки зору вивчених представлень, використовуючи той самий набір текстових підказок і відповідних реальних зображень у великомасштабних наборах даних, покладаючись виключно на синтетичні зображення. 

У документі продовжується: «Коли ми далі запроваджуємо нагляд за мовою, StableRep, навчений 20 мільйонами синтетичних зображень, досягає кращої точності, ніж CLIP, навчений 50 мільйонами реальних зображень».

SimCLR і CLIP — це алгоритми машинного навчання, які використовуються для створення зображень із текстових підказок.

Цей інноваційний підхід дозволяє розробникам штучного інтелекту навчати нейронні мережі з меншою кількістю синтетичних зображень, ніж з реальними, досягаючи кращих результатів. Поява методів, подібних до StableRep, свідчить про майбутнє, де моделі перетворення тексту в зображення можна буде навчати переважно на синтетичних даних, зменшуючи залежність від реальних зображень і підтримуючи механізми штучного інтелекту, коли стикаються з обмеженнями доступних онлайн-ресурсів.

відмова

Відповідно до Правила проекту Trust, будь ласка, зверніть увагу, що інформація, надана на цій сторінці, не призначена і не повинна тлумачитися як юридична, податкова, інвестиційна, фінансова або будь-яка інша форма консультації. Важливо інвестувати лише те, що ви можете дозволити собі втратити, і звернутися за незалежною фінансовою порадою, якщо у вас виникнуть сумніви. Щоб отримати додаткову інформацію, ми пропонуємо звернутися до положень та умов, а також до сторінок довідки та підтримки, наданих емітентом або рекламодавцем. MetaversePost прагне до точного, неупередженого звітування, але ринкові умови можуть змінюватися без попередження.

про автора

Аліса, відданий журналіст на MPost, спеціалізується на криптовалюті, доказах з нульовим знанням, інвестиціях і великій сфері Web3. З гострим поглядом на нові тенденції та технології, вона надає всебічне висвітлення, щоб інформувати та залучати читачів до постійно змінюваного ландшафту цифрових фінансів.

інші статті
Аліса Девідсон
Аліса Девідсон

Аліса, відданий журналіст на MPost, спеціалізується на криптовалюті, доказах з нульовим знанням, інвестиціях і великій сфері Web3. З гострим поглядом на нові тенденції та технології, вона надає всебічне висвітлення, щоб інформувати та залучати читачів до постійно змінюваного ландшафту цифрових фінансів.

Hot Stories
Приєднуйтеся до нашої розсилки.
Останні новини

Від Ripple до The Big Green DAO: як криптовалютні проекти сприяють благодійності

Давайте розглянемо ініціативи, які використовують потенціал цифрових валют для благодійних цілей.

Дізнайтеся більше

AlphaFold 3, Med-Gemini та інші: як AI трансформує охорону здоров’я у 2024 році

ШІ проявляється різними способами в охороні здоров’я, від виявлення нових генетичних кореляцій до розширення можливостей роботизованих хірургічних систем...

Дізнайтеся більше
Приєднуйтесь до нашої спільноти інноваційних технологій
Детальніше
Читати далі
Crypto Checkout: Як цифрові валюти формують електронну комерцію у 2024 році
Думка Business Електронна комерція Wiki Стиль життя ринки Технологія
Crypto Checkout: Як цифрові валюти формують електронну комерцію у 2024 році
Липень 15, 2024
TOP підтримує Akedo Games, сприяючи розвитку ігор Telegram в екосистемі TON
Business Звіт про новини Технологія
TOP підтримує Akedo Games, сприяючи розвитку ігор Telegram в екосистемі TON
Липень 15, 2024
​​Подолання блокчейн-бар’єрів: як змінюється сумісність крос-ланцюгів DeFi та формування майбутнього фінансів
ринки Софтвер Технологія
​​Подолання блокчейн-бар’єрів: як змінюється сумісність крос-ланцюгів DeFi та формування майбутнього фінансів
Липень 15, 2024
Монетний двір ініціює подію Mint Expedition, виділяючи 12% від загального обсягу поставок монетного двору для спільноти Airdrop Нагороди
Звіт про новини Технологія
Монетний двір ініціює подію Mint Expedition, виділяючи 12% від загального обсягу поставок монетного двору для спільноти Airdrop Нагороди
Липень 15, 2024
CRYPTOMERIA LABS PTE. LTD.