Google yangi matndan videoga AI generatorini, Imagen videoni ishga tushirish orqali metani yengib chiqdi
Qisqacha
Google Imagen Video video-generatorni qotil ilovalarga aylantirishga yordam berishga harakat qiladi
Google Meta-dan Video Make-a-Video-ga javob berish uchun ko'p vaqt talab qilmadi. Matn so'rovidan foydalanib, Tasvirli video ajoyib video yaratishi mumkin. Natijalar bir qator kamchiliklarga qaramay, eng ilg'or yutuqlardir.
Facebook-ning matndan videoga AI generatori bilan taqqoslaganda Video yaratish, natijalar sezilarli darajada yaxshilanadi. Biroq, bu strategiya ham ko'proq nazoratni talab qildi. Mikro ishchilar yozma tavsiflari bo'lgan filmlarga izoh berish uchun ko'p mehnat qilgan Imagen Videodan farqli o'laroq, Make-a-Scene trening uchun yorliqsiz videolardan foydalangan.
Arxitekturaning o'ziga xos xususiyatlariga kirish ma'nosizdir; bu haqda maqolada o'qishingiz kerak Bu yerga. Biz faqat 16 kvadrat T5 kodlovchining matn o'rnatilishidan sekundiga 48 kvadrat bilan 24 × 3 o'lchamlari bilan yaratilganligini va keyinchalik bu bir qator diffuziya modellari tomonidan 128 kvadratdan iborat yakuniy filmga ko'tarilganligini tasdiqlashimiz mumkin. 1280×768 va soniyasiga 24 kadr.
Imagen Video nima?
Imagen Video - bu bir qator video diffuziya modellari asosida matnli shartli videolarni yaratish usuli. Imagen Video yuqori sifatli filmlarni ishlab chiqaradi matnli takliflar asosiy video ishlab chiqarish modelini bir qator o'zaro bog'langan fazoviy va vaqtinchalik video o'ta aniqlikdagi modellar bilan birlashtirish orqali. Tizimni yuqori darajaga ko'tarishda dizayn tanlovlari guruhini ko'rib chiqing.definition matndan videoga model, shu jumladan diffuziya modellarini v-parametrlashtirish qarori va aniq rezolyutsiyalarda to'liq konvolyutsion vaqtinchalik va fazoviy o'ta aniqlik modellarini tanlash. Bundan tashqari, u diffuziyaga asoslangan tasvir ishlab chiqarish bo'yicha oldingi ishlar natijalarini tasdiqlaydi va kontekstga qo'llaydi video yaratish. Keyin video modellar tez, yuqori sifatli namuna olish uchun tasniflagichsiz ko'rsatmalar bilan progressiv distillashdan o'tkaziladi.
Google tadqiqot jamoasi tizim matnli tavsifni qabul qiladi va 16 kadrli film yaratadi sekundiga uchta kadr tezlikda 24 ga 48 piksel o'lchamlari bilan. Tizim sekundiga 128 kadr va 24p (720×1280) oʻlchamdagi 768 kadrli yakuniy videoni yaratib, qoʻshimcha kadrlarni oʻlchaydi va “bashoradi”. Imagen Videoni o'qitish uchun 60 million tasvir-matn juftligi va 14 million video-matn juftligi mavjud.
Tasviriy video namunalari
Video yaratish uchun sun'iy intellektdan foydalanish tezroq va arzonroq bo'lsa ham, bunday texnologiyalar, shubhasiz, hamma joyda qo'llaniladi.
Ko'proq o'qishga qiziqasizmi? Bu erda tekshirish uchun ba'zi qo'shimcha mavzular mavjud:
Masʼuliyatdan voz kechish
Bunga javoban Ishonch loyihasi bo'yicha ko'rsatmalar, iltimos, ushbu sahifada taqdim etilgan ma'lumotlar yuridik, soliq, investitsiya, moliyaviy yoki boshqa har qanday maslahat shakli sifatida talqin qilinmasligi va talqin qilinmasligini unutmang. Faqat yo'qotishingiz mumkin bo'lgan narsaga investitsiya qilish va agar shubhangiz bo'lsa, mustaqil moliyaviy maslahat olish muhimdir. Qo'shimcha ma'lumot olish uchun biz shartlar va emitent yoki reklama beruvchi tomonidan taqdim etilgan yordam va qo'llab-quvvatlash sahifalariga murojaat qilishni tavsiya qilamiz. MetaversePost to'g'ri, xolis hisobot berish majburiyatini oladi, lekin bozor sharoitlari ogohlantirilmasdan o'zgarishi mumkin.
Muallif haqida
Damir - guruh rahbari, mahsulot menejeri va muharrir Metaverse Post, AI/ML, AGI, LLMs, Metaverse va kabi mavzularni qamrab oladi Web3- tegishli sohalar. Uning maqolalari har oy milliondan ortiq foydalanuvchilarning katta auditoriyasini jalb qiladi. U SEO va raqamli marketing bo'yicha 10 yillik tajribaga ega mutaxassis bo'lib ko'rinadi. Damir haqida Mashable, Wired nashrlarida tilga olingan. Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto va boshqa nashrlar. U BAA, Turkiya, Rossiya va MDH davlatlari oʻrtasida raqamli koʻchmanchi sifatida sayohat qiladi. Damir fizika bo'yicha bakalavr darajasini oldi, uning fikricha, bu unga internetning doimiy o'zgaruvchan manzarasida muvaffaqiyatga erishish uchun zarur bo'lgan tanqidiy fikrlash qobiliyatlarini berdi.
Boshqa maqolalarDamir - guruh rahbari, mahsulot menejeri va muharrir Metaverse Post, AI/ML, AGI, LLMs, Metaverse va kabi mavzularni qamrab oladi Web3- tegishli sohalar. Uning maqolalari har oy milliondan ortiq foydalanuvchilarning katta auditoriyasini jalb qiladi. U SEO va raqamli marketing bo'yicha 10 yillik tajribaga ega mutaxassis bo'lib ko'rinadi. Damir haqida Mashable, Wired nashrlarida tilga olingan. Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto va boshqa nashrlar. U BAA, Turkiya, Rossiya va MDH davlatlari oʻrtasida raqamli koʻchmanchi sifatida sayohat qiladi. Damir fizika bo'yicha bakalavr darajasini oldi, uning fikricha, bu unga internetning doimiy o'zgaruvchan manzarasida muvaffaqiyatga erishish uchun zarur bo'lgan tanqidiy fikrlash qobiliyatlarini berdi.