Модель преобразования текста в видео Gen-2 может генерировать короткие видеоролики с использованием текстовых подсказок
Коротко
Новая модель Text2Video Gen-2 от RunWayML позволяет не только редактировать существующие видео но и генерировать новые с нуля, используя только текстовую подсказку.
Ожидается, что эта функция улучшит способы создания и обмена контентом на платформах социальных сетей, позволяя пользователям трансформироваться. статические изображения в динамические и захватывающие видеоклипы без каких-либо предварительных знаний в области редактирования видео.
Новая модель преобразования текста в видео Gen-2 от Runway может не только редактировать существующие видео, но и генерировать новые с нуля, используя только текстовую подсказку. Это значительное улучшение по сравнению с предыдущей версией Gen, которая могла редактировать только существующие видео. В модели преобразования текста в видео Gen-2 используется передовая технология искусственного интеллекта Runway для создания видеороликов, неотличимых от созданных людьми. С помощью этой новой функции пользователи могут сэкономить время и усилия, автоматически создавая видео без необходимости обширных навыков редактирования видео.
Новая модель Gen-2 также может превращать загруженное изображение в Короткое видео клип. Это делается путем предоставления текстовой подсказки, описывающей, каким пользователь хочет видеть видео. Пока длительность роликов не превышает нескольких секунд, но качество уже намного выше, чем у конкурентов (тем более, что у конкурентов нейронные сети в открытом доступе нет). Ожидается, что эта функция улучшит то, как люди создают и делятся контентом на платформах социальных сетей. С помощью модели Gen-2 пользователи могут легко преобразовывать свои статические изображения в динамические видеоклипы. Есть большая вероятность, что Facebook или Tiktok будут использовать эту технологию для расширения набора инструментов ИИ, доступных создателям контента.
гонка ИИ-видео дикая. Прошла всего неделя с момента запуска Gen-1, а Gen-2 уже вышел. Конкуренция между технологическими компаниями за разработку самой передовой видеотехнологии искусственного интеллекта быстро растет, и каждая компания стремится превзойти другую.
Чтобы попробовать новую версию Gen, вам нужно будет записаться в очередь на Сайт взлетно-посадочной полосы.
- Runway, стартап искусственного интеллекта, анонсировано Gen-1, нейронная сеть, которая может превращать старые видео в новые, комбинируя подсказки и изображения. Gen-1 позволяет кинематографистам быстро и экономично создавать контент, применяя композицию и стиль изображение или текстовая подсказка к структуре исходного видео. Runway Research занимается созданием мультимодальных систем искусственного интеллекта, которые обеспечивают новые формы творчества, а Gen-1 можно использовать для экспериментов с будущим повествования.
- В прошлом месяце Сэм Альтман, соучредитель и генеральный директор OpenAI, недавно говорил с TechCrunch и сказал, что OpenAI разрабатывает Модель ИИ для видео и GPT-4, который станет общедоступным после того, как компания подтвердит свою надежность и безопасность.
- В октябре Google разработал Imagen Video — метод создания текстовых видеороликов на основе серии видеороликов. диффузионные модели. Система принимает текстовое описание и генерирует 16-кадровый фильм со скоростью три кадра в секунду и разрешением 24 на 48 пикселей. Система масштабирует и «прогнозирует» дополнительные кадры, создавая итоговое видео из 128 кадров с частотой 24 кадра в секунду и разрешением 720p (1280×768). Для обучения Imagen Video было использовано шестьдесят миллионов пар изображение-текст и 14 миллионов пар видео-текст.
Читайте больше статей по теме:
Отказ от ответственности
В соответствии с Руководство трастового проектаОбратите внимание, что информация, представленная на этой странице, не предназначена и не должна интерпретироваться как юридическая, налоговая, инвестиционная, финансовая или любая другая форма консультации. Важно инвестировать только то, что вы можете позволить себе потерять, и обращаться за независимой финансовой консультацией, если у вас есть какие-либо сомнения. Для получения дополнительной информации мы предлагаем обратиться к положениям и условиям, а также к страницам справки и поддержки, предоставленным эмитентом или рекламодателем. MetaversePost стремится предоставлять точную и объективную отчетность, однако рыночные условия могут быть изменены без предварительного уведомления.
Об авторе
Дамир — руководитель группы, менеджер по продукту и редактор в Metaverse Post, охватывающие такие темы, как AI/ML, AGI, LLM, Metaverse и Web3-связанные поля. Его статьи ежемесячно привлекают огромную аудиторию, насчитывающую более миллиона пользователей. Похоже, он эксперт с 10-летним опытом работы в области SEO и цифрового маркетинга. Дамир упоминается в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и другие издания. Он путешествует между ОАЭ, Турцией, Россией и СНГ в качестве цифрового кочевника. Дамир получил степень бакалавра в области физики, что, по его мнению, дало ему навыки критического мышления, необходимые для достижения успеха в постоянно меняющемся мире Интернета.
Другие статьиДамир — руководитель группы, менеджер по продукту и редактор в Metaverse Post, охватывающие такие темы, как AI/ML, AGI, LLM, Metaverse и Web3-связанные поля. Его статьи ежемесячно привлекают огромную аудиторию, насчитывающую более миллиона пользователей. Похоже, он эксперт с 10-летним опытом работы в области SEO и цифрового маркетинга. Дамир упоминается в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и другие издания. Он путешествует между ОАЭ, Турцией, Россией и СНГ в качестве цифрового кочевника. Дамир получил степень бакалавра в области физики, что, по его мнению, дало ему навыки критического мышления, необходимые для достижения успеха в постоянно меняющемся мире Интернета.