Модель Gen-2 для перетворення тексту у відео може створювати короткі відео за допомогою текстових підказок
Коротко
Нова модель Text2Video Gen-2 від RunWayML може не тільки редагувати існуючі Відео але також створюйте нові з нуля, використовуючи лише текстову підказку.
Очікується, що ця функція покращить те, як люди створюють і діляться вмістом на платформах соціальних мереж, дозволяючи користувачам трансформуватися статичні зображення в динамічні і захоплюючі відеокліпи без попереднього знання відеомонтажу.
Нова модель перетворення тексту у відео Gen-2 від Runway може не лише редагувати наявні відео, але й створювати нові з нуля, використовуючи лише текстову підказку. Це значне покращення порівняно з попередньою версією Gen, яка могла редагувати лише наявні відео. Модель Gen-2 для перетворення тексту у відео використовує передову технологію штучного інтелекту Runway для створення відео, яке неможливо відрізнити від відео, створених людьми. Завдяки цій новій функції користувачі можуть заощаджувати час і зусилля, автоматично генеруючи відео, не потребуючи великих навичок редагування відео.
Нова модель Gen-2 також здатна перетворювати завантажене зображення на коротке відео кліп. Це робиться шляхом надання текстової підказки, яка описує, яким користувач хоче бачити відео. Поки що тривалість роликів не перевищує кількох секунд, але якість вже значно вища, ніж у конкурентів (тим більше, що у конкурентів нейронні мережі не є загальнодоступними). Очікується, що ця функція покращить те, як люди створюють і діляться вмістом на платформах соціальних мереж. За допомогою моделі Gen-2 користувачі можуть легко перетворювати свої статичні зображення на динамічні відеокліпи. Існує велика ймовірність того, що Facebook або Tiktok використовуватимуть цю технологію для розширення набору інструментів ШІ, доступних творцям контенту.
ШІ-відеогонка дика. Минув лише тиждень після запуску Gen-1, а Gen-2 вже вийшов. Конкуренція між технологічними компаніями за розробку найпередовіших відеотехнологій ШІ стрімко зростає, і кожна компанія прагне перевершити іншу.
Щоб спробувати нову версію Gen, вам доведеться записатись у чергу на сайті Сайт злітної смуги.
- Runway, стартап зі штучного інтелекту, оголосив Gen-1, нейронна мережа, яка може перетворювати старі відео на нові, поєднуючи підказки та зображення. Gen-1 дозволяє кінематографістам швидко створювати контент економічно ефективним способом, застосовуючи композицію та стиль зображення або текстова підказка до структури вихідного відео. Runway Research присвячена створенню мультимодальних систем штучного інтелекту, які дозволяють нові форми творчості, а Gen-1 можна використовувати для експериментів з майбутнім оповідання історій.
- Минулого місяця Сем Альтман, співзасновник і генеральний директор компанії OpenAI, нещодавно розмовляв з TechCrunch і сказав це OpenAI розвивається AI модель для відео та GPT-4, який стане доступним для громадськості після того, як компанія підтвердить свою надійність і безпеку.
- У жовтні Google розробив Imagen Video, метод створення текстових умовних відео на основі серії відео дифузійні моделі. Система приймає текстовий опис і генерує 16-кадровий фільм зі швидкістю три кадри в секунду з роздільною здатністю 24 на 48 пікселів. Система масштабує та «прогнозує» додаткові кадри, створюючи остаточне відео зі 128 кадрами зі швидкістю 24 кадри в секунду та роздільною здатністю 720p (1280×768). Для навчання Imagen Video було використано 14 мільйонів пар зображення-текст і XNUMX мільйонів пар відео-текст.
Читайте більше пов’язаних статей:
відмова
Відповідно до Правила проекту Trust, будь ласка, зверніть увагу, що інформація, надана на цій сторінці, не призначена і не повинна тлумачитися як юридична, податкова, інвестиційна, фінансова або будь-яка інша форма консультації. Важливо інвестувати лише те, що ви можете дозволити собі втратити, і звернутися за незалежною фінансовою порадою, якщо у вас виникнуть сумніви. Щоб отримати додаткову інформацію, ми пропонуємо звернутися до положень та умов, а також до сторінок довідки та підтримки, наданих емітентом або рекламодавцем. MetaversePost прагне до точного, неупередженого звітування, але ринкові умови можуть змінюватися без попередження.
про автора
Дамір є керівником групи, менеджером із продуктів і редактором Metaverse Post, що охоплює такі теми, як AI/ML, AGI, LLMs, Metaverse тощо Web3- суміжні поля. Його статті щомісяця приваблюють величезну аудиторію понад мільйон користувачів. Здається, він є експертом із 10-річним досвідом роботи в SEO та цифровому маркетингу. Даміра згадували в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto та інші видання. Він подорожує між ОАЕ, Туреччиною, Росією та СНД як цифровий кочівник. Дамір отримав ступінь бакалавра з фізики, що, на його думку, дало йому навички критичного мислення, необхідні для досягнення успіху в Інтернеті, який постійно змінюється.
інші статтіДамір є керівником групи, менеджером із продуктів і редактором Metaverse Post, що охоплює такі теми, як AI/ML, AGI, LLMs, Metaverse тощо Web3- суміжні поля. Його статті щомісяця приваблюють величезну аудиторію понад мільйон користувачів. Здається, він є експертом із 10-річним досвідом роботи в SEO та цифровому маркетингу. Даміра згадували в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto та інші видання. Він подорожує між ОАЕ, Туреччиною, Росією та СНД як цифровий кочівник. Дамір отримав ступінь бакалавра з фізики, що, на його думку, дало йому навички критичного мислення, необхідні для досягнення успіху в Інтернеті, який постійно змінюється.