Meta запускає дві нові генеративні функції ШІ для редагування відео у Facebook та Instagram
Коротко
Meta запустила дві генеративні функції штучного інтелекту для редагування відео – «Emu Video» та «Emu Edit» – для покращення публікацій користувачів у Facebook та Instagram.
Марк Цукерберг володіє гігантом соціальних мереж Meta у четвер запустив дві нові функції для редагування відео на основі генеративного штучного інтелекту під назвами «Emu Video» та «Emu Edit», які дозволяють користувачам публікувати публікації у Facebook та Instagram.
Emu Video дозволить користувачам створювати чотирисекундні відеозаписи з підказкою, фотографією або зображенням у поєднанні з описом; тоді як Emu Edit надасть користувачам простіший спосіб редагування або зміни відео за допомогою текстових підказок.
За словами гіганта соціальних мереж, розробки є частиною ему (Expressive Media Universe) – перша базова модель компанії, анонсована у вересні 2023 року, яка може створювати неймовірно реалістичні та естетично привабливі зображення з текстових підписів.
Визначною особливістю Emu є його техніка «настроювання якості», яка підвищує візуальну привабливість зображень, створених за допомогою моделей штучного інтелекту, що перетворюють текст у зображення, додає він.
В основі Ему генеративний ШІ Технологія — це набір інструментів штучного інтелекту для редагування зображень для Instagram, які дають змогу користувачам клацати фотографію та змінювати її візуальний стиль або фон.
Протягом останнього року компанії та підприємства були залучені до нового ринку генеративного ШІ, шукаючи розширених можливостей і оптимізованих бізнес-процесів після дебюту OpenAIАвтора ChatGPT минулого року.
Ключова відмінність Emu від інших генеративних інструментів ШІ
Підхід Emu Video передбачає двоетапний процес: по-перше, він зосереджується на створенні зображень на основі певної текстової підказки; а потім створює відео на основі оригінального тексту та створеного зображення. Ця «факторизована» або розділена стратегія генерації відео підвищує ефективність і дозволяє ефективно навчати моделі генерації відео.
Emu Video має на меті продемонструвати, що факторизовано генерація відео може бути реалізовано за допомогою єдиної моделі дифузії. Представляючи ключові дизайнерські рішення, такі як точне налаштування графіків шуму, спеціально розроблених для розповсюдження відео, Meta намагається вдосконалити свою технологію далі.
Ще однією особливістю Meta є реалізація багатоетапного навчання, яке дозволяє безпосередньо генерувати відео з вищою роздільною здатністю, демонструючи потенціал Emu Video для підвищення якості відеовмісту.
Відповідно до Meta, Emu Edit вирішує загальну проблему – багато підходів мають тенденцію до надмірної модифікації або недостатньої ефективності різних завдань редагування, що призводить до неоптимальних результатів. Основна мета редагування зображень не повинна зосереджуватися лише на створенні «правдоподібного» зображення, натомість слід зосередитися на точній зміні лише пікселів, які відповідають конкретному запиту редагування.
На відміну від інших генеративні моделі ШІ, Emu Edit дотримується вказівок, щоб гарантувати, що пікселі у вхідному зображенні, не пов’язані з указаними змінами, залишаються недоторканими.
Завдяки таким оголошенням і технологічним удосконаленням Meta позиціонує себе як головний центр у конкурентному середовищі поряд із такими гігантами, як Microsoft, Alphabet Google і Amazon.
відмова
Відповідно до Правила проекту Trust, будь ласка, зверніть увагу, що інформація, надана на цій сторінці, не призначена і не повинна тлумачитися як юридична, податкова, інвестиційна, фінансова або будь-яка інша форма консультації. Важливо інвестувати лише те, що ви можете дозволити собі втратити, і звернутися за незалежною фінансовою порадою, якщо у вас виникнуть сумніви. Щоб отримати додаткову інформацію, ми пропонуємо звернутися до положень та умов, а також до сторінок довідки та підтримки, наданих емітентом або рекламодавцем. MetaversePost прагне до точного, неупередженого звітування, але ринкові умови можуть змінюватися без попередження.
про автора
Кумар є досвідченим технічним журналістом, який спеціалізується на динамічному перетині ШІ/ML, маркетингових технологій і нових галузей, таких як криптовалюта, блокчейн і NFTs. Завдяки більш ніж 3-річному досвіду роботи в галузі Кумар має досвід створення переконливих оповідей, проведення проникливих інтерв’ю та надання вичерпної інформації. Досвід Кумара полягає у створенні вражаючого контенту, зокрема статей, звітів і дослідницьких публікацій для відомих галузевих платформ. Володіючи унікальним набором навичок, який поєднує в собі технічні знання та розповідь, Кумар чудово вміє доносити складні технологічні концепції до різноманітної аудиторії в чіткій та привабливій формі.
інші статті
Кумар є досвідченим технічним журналістом, який спеціалізується на динамічному перетині ШІ/ML, маркетингових технологій і нових галузей, таких як криптовалюта, блокчейн і NFTs. Завдяки більш ніж 3-річному досвіду роботи в галузі Кумар має досвід створення переконливих оповідей, проведення проникливих інтерв’ю та надання вичерпної інформації. Досвід Кумара полягає у створенні вражаючого контенту, зокрема статей, звітів і дослідницьких публікацій для відомих галузевих платформ. Володіючи унікальним набором навичок, який поєднує в собі технічні знання та розповідь, Кумар чудово вміє доносити складні технологічні концепції до різноманітної аудиторії в чіткій та привабливій формі.