Laporan Berita Teknologi
Mac 22, 2023

Model Teks-ke-Video Gen-2 Boleh Menghasilkan Video Pendek Menggunakan Gesaan Teks

Secara ringkas

Model Text2Video Gen-2 baharu daripada RunWayML bukan sahaja boleh mengedit sedia ada dan tetapi juga menjana yang baharu dari awal, hanya menggunakan gesaan teks.

Ciri ini dijangka dapat menambah baik cara orang mencipta dan berkongsi kandungan pada platform media sosial, membolehkan pengguna berubah imej statik menjadi dinamik dan klip video yang menarik tanpa pengetahuan awal tentang penyuntingan video.

Model teks-ke-video baharu Gen-2 daripada Runway bukan sahaja boleh mengedit video sedia ada tetapi juga menjana video baharu dari awal, hanya menggunakan gesaan teks. Ini merupakan peningkatan yang ketara berbanding versi Gen sebelumnya, yang hanya boleh mengedit video sedia ada. Model teks-ke-video Gen-2 menggunakan teknologi AI termaju Runway untuk mencipta video yang tidak dapat dibezakan daripada yang dibuat oleh manusia. Dengan ciri baharu ini, pengguna boleh menjimatkan masa dan usaha dengan menjana video secara automatik tanpa memerlukan kemahiran penyuntingan video yang meluas.

Model Teks-ke-Video Gen-2 Boleh Menghasilkan Video Pendek Menggunakan Gesaan Teks

Model Gen-2 baharu juga mampu menukar imej yang dimuat naik menjadi a video pendek klip. Ini dilakukan dengan menyediakan pembayang teks yang menerangkan perkara yang pengguna mahukan video itu. Setakat ini, tempoh video tidak melebihi beberapa saat, tetapi kualitinya sudah jauh lebih tinggi daripada pesaing (terutamanya kerana pesaing rangkaian saraf tidak tersedia secara umum). Ciri ini dijangka dapat menambah baik cara orang mencipta dan berkongsi kandungan pada platform media sosial. Dengan model Gen-2, pengguna boleh menukar imej statik mereka kepada klip video dinamik dengan mudah. Ada kemungkinan besar Facebook atau Tiktok akan menggunakan teknologi ini untuk mengembangkan set alat AI yang tersedia untuk pencipta kandungan.

perlumbaan video AI adalah liar. Hanya seminggu telah berlalu sejak pelancaran Gen-1, dan Gen-2 sudah pun keluar. Persaingan di kalangan syarikat teknologi untuk membangunkan teknologi video AI yang paling maju semakin meningkat dengan pesat, dengan setiap syarikat berusaha untuk mengatasi yang lain.

Untuk mencuba versi baharu Gen, anda perlu mendaftar dalam baris gilir pada Laman web landasan.

  • Landasan, permulaan kecerdasan buatan, mengumumkan Gen-1, rangkaian saraf yang boleh menukar video lama kepada yang baharu dengan menggabungkan gesaan dan imej. Gen-1 membolehkan pembuat filem menghasilkan kandungan dengan cepat dengan cara yang kos efektif dengan menggunakan komposisi dan gaya gesaan imej atau teks kepada struktur video sumber. Runway Research didedikasikan untuk membina sistem AI multimodal yang membolehkan bentuk kreativiti baharu, dan Gen-1 boleh digunakan untuk bereksperimen dengan masa depan bercerita.
  • Bulan lalu, Sam Altman, pengasas bersama dan Ketua Pegawai Eksekutif OpenAI, baru-baru ini bercakap dengan TechCrunch dan berkata demikian OpenAI sedang membangunkan sebuah Model AI untuk video and GPT-4, yang akan tersedia kepada orang ramai selepas syarikat mengesahkan kebolehpercayaan dan keselamatannya.
  • Pada bulan Oktober, Google telah membangunkan Imagen Video, kaedah untuk mencipta video bersyarat teks berdasarkan satu siri video model penyebaran. Sistem ini menerima penerangan teks dan menghasilkan filem 16 bingkai pada tiga bingkai sesaat dengan resolusi 24 kali 48 piksel. Sistem menskala dan "meramalkan" bingkai tambahan, mencipta video akhir dengan 128 bingkai pada 24 bingkai sesaat dan resolusi 720p (1280×768). Enam puluh juta pasangan teks imej dan 14 juta pasangan teks video digunakan untuk melatih Imagen Video.

Baca lebih banyak artikel berkaitan:

Penafian

Selaras dengan Garis panduan Projek Amanah, sila ambil perhatian bahawa maklumat yang diberikan pada halaman ini tidak bertujuan untuk menjadi dan tidak seharusnya ditafsirkan sebagai nasihat undang-undang, cukai, pelaburan, kewangan atau sebarang bentuk nasihat lain. Adalah penting untuk hanya melabur apa yang anda mampu kehilangan dan mendapatkan nasihat kewangan bebas jika anda mempunyai sebarang keraguan. Untuk maklumat lanjut, kami mencadangkan merujuk kepada terma dan syarat serta halaman bantuan dan sokongan yang disediakan oleh pengeluar atau pengiklan. MetaversePost komited kepada laporan yang tepat dan tidak berat sebelah, tetapi keadaan pasaran tertakluk kepada perubahan tanpa notis.

Tentang Pengarang

Damir ialah ketua pasukan, pengurus produk dan editor di Metaverse Post, meliputi topik seperti AI/ML, AGI, LLM, Metaverse dan Web3-bidang berkaitan. Artikelnya menarik khalayak besar lebih sejuta pengguna setiap bulan. Dia nampaknya seorang pakar dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebut dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto dan penerbitan lain. Dia mengembara antara UAE, Turki, Rusia dan CIS sebagai nomad digital. Damir memperoleh ijazah sarjana muda dalam fizik, yang dia percaya telah memberikannya kemahiran berfikir kritis yang diperlukan untuk berjaya dalam landskap internet yang sentiasa berubah. 

lebih banyak artikel
Damir Yalalov
Damir Yalalov

Damir ialah ketua pasukan, pengurus produk dan editor di Metaverse Post, meliputi topik seperti AI/ML, AGI, LLM, Metaverse dan Web3-bidang berkaitan. Artikelnya menarik khalayak besar lebih sejuta pengguna setiap bulan. Dia nampaknya seorang pakar dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebut dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto dan penerbitan lain. Dia mengembara antara UAE, Turki, Rusia dan CIS sebagai nomad digital. Damir memperoleh ijazah sarjana muda dalam fizik, yang dia percaya telah memberikannya kemahiran berfikir kritis yang diperlukan untuk berjaya dalam landskap internet yang sentiasa berubah. 

Dari Ripple kepada The Big Green DAO: Bagaimana Projek Mata Wang Kripto Menyumbang kepada Amal

Mari kita terokai inisiatif yang memanfaatkan potensi mata wang digital untuk tujuan amal.

Mengetahui lebih lanjut

AlphaFold 3, Med-Gemini, dan lain-lain: The Way AI Transforms Healthcare in 2024

AI menjelma dalam pelbagai cara dalam penjagaan kesihatan, daripada mendedahkan korelasi genetik baharu kepada memperkasakan sistem pembedahan robotik ...

Mengetahui lebih lanjut
Sertai Komuniti Teknologi Inovatif Kami
Lebih Lanjut
Maklumat Lanjut
10 Alat AI Percuma Teratas untuk Penciptaan Kandungan, Penyuntingan Video dan Banyak Lagi
AI Wiki Digest Pendidikan Gaya hidup perisian Teknologi
10 Alat AI Percuma Teratas untuk Penciptaan Kandungan, Penyuntingan Video dan Banyak Lagi
Semoga 14, 2024
Suruhanjaya Sekuriti Hong Kong Memberi Amaran tentang Penipuan Deepfake yang Menyasarkan Industri Kripto: Implikasi untuk Keselamatan Pelabur
Gaya hidup Keselamatan Wiki perisian Cerita dan Ulasan Teknologi
Suruhanjaya Sekuriti Hong Kong Memberi Amaran tentang Penipuan Deepfake yang Menyasarkan Industri Kripto: Implikasi untuk Keselamatan Pelabur
Semoga 14, 2024
Ripple Dan Evmos Bekerjasama Membangunkan XRP Ledger EVM Sidechain Dengan Teknologi EvmOS
Perniagaan Laporan Berita Teknologi
Ripple Dan Evmos Bekerjasama Membangunkan XRP Ledger EVM Sidechain Dengan Teknologi EvmOS
Semoga 14, 2024
5ireChain Memulakan Insentif 'Testnet Thunder: GA' Untuk Ujian Tekanan Rangkaian, Menjemput Pengguna Untuk Menyertai Airdrop Ganjaran
Laporan Berita Teknologi
5ireChain Memulakan Insentif 'Testnet Thunder: GA' Untuk Ujian Tekanan Rangkaian, Menjemput Pengguna Untuk Menyertai Airdrop Ganjaran
Semoga 14, 2024