Звіт про новини Технологія
Березня 22, 2023

Модель Gen-2 для перетворення тексту у відео може створювати короткі відео за допомогою текстових підказок

Коротко

Нова модель Text2Video Gen-2 від RunWayML може не тільки редагувати існуючі Відео але також створюйте нові з нуля, використовуючи лише текстову підказку.

Очікується, що ця функція покращить те, як люди створюють і діляться вмістом на платформах соціальних мереж, дозволяючи користувачам трансформуватися статичні зображення в динамічні і захоплюючі відеокліпи без попереднього знання відеомонтажу.

Нова модель перетворення тексту у відео Gen-2 від Runway може не лише редагувати наявні відео, але й створювати нові з нуля, використовуючи лише текстову підказку. Це значне покращення порівняно з попередньою версією Gen, яка могла редагувати лише наявні відео. Модель Gen-2 для перетворення тексту у відео використовує передову технологію штучного інтелекту Runway для створення відео, яке неможливо відрізнити від відео, створених людьми. Завдяки цій новій функції користувачі можуть заощаджувати час і зусилля, автоматично генеруючи відео, не потребуючи великих навичок редагування відео.

Модель Gen-2 для перетворення тексту у відео може створювати короткі відео за допомогою текстових підказок

Нова модель Gen-2 також здатна перетворювати завантажене зображення на коротке відео кліп. Це робиться шляхом надання текстової підказки, яка описує, яким користувач хоче бачити відео. Поки що тривалість роликів не перевищує кількох секунд, але якість вже значно вища, ніж у конкурентів (тим більше, що у конкурентів нейронні мережі не є загальнодоступними). Очікується, що ця функція покращить те, як люди створюють і діляться вмістом на платформах соціальних мереж. За допомогою моделі Gen-2 користувачі можуть легко перетворювати свої статичні зображення на динамічні відеокліпи. Існує велика ймовірність того, що Facebook або Tiktok використовуватимуть цю технологію для розширення набору інструментів ШІ, доступних творцям контенту.

ШІ-відеогонка дика. Минув лише тиждень після запуску Gen-1, а Gen-2 вже вийшов. Конкуренція між технологічними компаніями за розробку найпередовіших відеотехнологій ШІ стрімко зростає, і кожна компанія прагне перевершити іншу.

Щоб спробувати нову версію Gen, вам доведеться записатись у чергу на сайті Сайт злітної смуги.

  • Runway, стартап зі штучного інтелекту, оголосив Gen-1, нейронна мережа, яка може перетворювати старі відео на нові, поєднуючи підказки та зображення. Gen-1 дозволяє кінематографістам швидко створювати контент економічно ефективним способом, застосовуючи композицію та стиль зображення або текстова підказка до структури вихідного відео. Runway Research присвячена створенню мультимодальних систем штучного інтелекту, які дозволяють нові форми творчості, а Gen-1 можна використовувати для експериментів з майбутнім оповідання історій.
  • Минулого місяця Сем Альтман, співзасновник і генеральний директор компанії OpenAI, нещодавно розмовляв з TechCrunch і сказав це OpenAI розвивається AI модель для відео та GPT-4, який стане доступним для громадськості після того, як компанія підтвердить свою надійність і безпеку.
  • У жовтні Google розробив Imagen Video, метод створення текстових умовних відео на основі серії відео дифузійні моделі. Система приймає текстовий опис і генерує 16-кадровий фільм зі швидкістю три кадри в секунду з роздільною здатністю 24 на 48 пікселів. Система масштабує та «прогнозує» додаткові кадри, створюючи остаточне відео зі 128 кадрами зі швидкістю 24 кадри в секунду та роздільною здатністю 720p (1280×768). Для навчання Imagen Video було використано 14 мільйонів пар зображення-текст і XNUMX мільйонів пар відео-текст.

Читайте більше пов’язаних статей:

відмова

Відповідно до Правила проекту Trust, будь ласка, зверніть увагу, що інформація, надана на цій сторінці, не призначена і не повинна тлумачитися як юридична, податкова, інвестиційна, фінансова або будь-яка інша форма консультації. Важливо інвестувати лише те, що ви можете дозволити собі втратити, і звернутися за незалежною фінансовою порадою, якщо у вас виникнуть сумніви. Щоб отримати додаткову інформацію, ми пропонуємо звернутися до положень та умов, а також до сторінок довідки та підтримки, наданих емітентом або рекламодавцем. MetaversePost прагне до точного, неупередженого звітування, але ринкові умови можуть змінюватися без попередження.

про автора

Дамір є керівником групи, менеджером із продуктів і редактором Metaverse Post, що охоплює такі теми, як AI/ML, AGI, LLMs, Metaverse тощо Web3- суміжні поля. Його статті щомісяця приваблюють величезну аудиторію понад мільйон користувачів. Здається, він є експертом із 10-річним досвідом роботи в SEO та цифровому маркетингу. Даміра згадували в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto та інші видання. Він подорожує між ОАЕ, Туреччиною, Росією та СНД як цифровий кочівник. Дамір отримав ступінь бакалавра з фізики, що, на його думку, дало йому навички критичного мислення, необхідні для досягнення успіху в Інтернеті, який постійно змінюється. 

інші статті
Дамір Ялалов
Дамір Ялалов

Дамір є керівником групи, менеджером із продуктів і редактором Metaverse Post, що охоплює такі теми, як AI/ML, AGI, LLMs, Metaverse тощо Web3- суміжні поля. Його статті щомісяця приваблюють величезну аудиторію понад мільйон користувачів. Здається, він є експертом із 10-річним досвідом роботи в SEO та цифровому маркетингу. Даміра згадували в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto та інші видання. Він подорожує між ОАЕ, Туреччиною, Росією та СНД як цифровий кочівник. Дамір отримав ступінь бакалавра з фізики, що, на його думку, дало йому навички критичного мислення, необхідні для досягнення успіху в Інтернеті, який постійно змінюється. 

Hot Stories
Приєднуйтеся до нашої розсилки.
Останні новини

Від Ripple до The Big Green DAO: як криптовалютні проекти сприяють благодійності

Давайте розглянемо ініціативи, які використовують потенціал цифрових валют для благодійних цілей.

Дізнайтеся більше

AlphaFold 3, Med-Gemini та інші: як AI трансформує охорону здоров’я у 2024 році

ШІ проявляється різними способами в охороні здоров’я, від виявлення нових генетичних кореляцій до розширення можливостей роботизованих хірургічних систем...

Дізнайтеся більше
Приєднуйтесь до нашої спільноти інноваційних технологій
Детальніше
Читати далі
Від Ripple до The Big Green DAO: як криптовалютні проекти сприяють благодійності
аналіз криптовалютні гаманці Wiki Business Освіта Стиль життя ринки Софтвер Технологія
Від Ripple до The Big Green DAO: як криптовалютні проекти сприяють благодійності
Травень 13, 2024
AlphaFold 3, Med-Gemini та інші: як AI трансформує охорону здоров’я у 2024 році
AI Wiki аналіз Digest Думка Business ринки Звіт про новини Софтвер Розповіді та огляди Технологія
AlphaFold 3, Med-Gemini та інші: як AI трансформує охорону здоров’я у 2024 році
Травень 13, 2024
Мережа Nim розгортає структуру токенізації AI Ownership і проводить продаж доходів із датою моментального знімка, запланованою на травень
ринки Звіт про новини Технологія
Мережа Nim розгортає структуру токенізації AI Ownership і проводить продаж доходів із датою моментального знімка, запланованою на травень
Травень 13, 2024
Binance співпрацює з Аргентиною для боротьби з кіберзлочинністю
Думка Business ринки Звіт про новини Софтвер Технологія
Binance співпрацює з Аргентиною для боротьби з кіберзлочинністю
Травень 13, 2024
CRYPTOMERIA LABS PTE. LTD.