Google, mətndən videoya yeni süni intellekt generatorunu, Şəkil Videosunu işə salmaqla Meta-ya qalib gəldi
Qısaca
Google-un Imagen Videosu video-generatorun öldürücü proqramlara çevrilməsinə kömək etməyə çalışır
Google-un Meta-dan Make-a-Video-ya cavab verməsi çox çəkmədi. Mətn sorğusundan istifadə edərək, Şəkil Video fantastik video yarada bilər. Nəticələr, bir sıra çatışmazlıqlara baxmayaraq, ən müasir səviyyədən böyük irəliləyişdir.
Facebook-un Text-to-Video AI generatoru ilə müqayisədə Video Yaradın, nəticələr nəzərəçarpacaq dərəcədə yaxşıdır. Bununla belə, bu strategiya daha çox nəzarət tələb edirdi. Mikro işçilərin yazılı təsvirləri olan filmlərə şərh yazmaq üçün çox çalışdıqları Imagen Videodan fərqli olaraq, Make-a-Scene təlim üçün etiketsiz videolardan istifadə etdi.
Memarlığın xüsusiyyətlərinə girmək mənasızdır; bu barədə məqalədə oxumalısınız burada. Biz yalnız təsdiq edə bilərik ki, T16 kodlayıcısının mətn daxil edilməsindən əvvəlcə saniyədə 5 kadr ilə 48×24 qətnamə ilə 3 kadr yaradılır və bunun daha sonra bir sıra diffuziya modelləri ilə 128 kadrdan ibarət son filmə yüksəldilməsi təsdiqlənir. 1280×768 və saniyədə 24 kadr.
Imagen Video nədir?
Imagen Video bir sıra video diffuziya modelləri əsasında mətn-şərti videolar yaratmaq üçün bir üsuldur. Imagen Video yüksək keyfiyyətli filmlər istehsal edir mətn təklifləri əsas video istehsal modelini bir sıra interlaced məkan və müvəqqəti video super rezolyusiya modelləri ilə birləşdirərək. Sistemi yüksək səviyyədə genişləndirərkən dizayn seçimləri qrupunu nəzərdən keçirin.definition mətndən videoya model, o cümlədən diffuziya modellərinin v-parametrləşdirilməsi qərarı və xüsusi qətnamələrdə tam konvolyusiyaya malik müvəqqəti və məkan super rezolyusiya modellərinin seçilməsi. Bundan əlavə, o, diffuziya əsaslı görüntü istehsalı üzrə əvvəlki işlərin nəticələrini təsdiq edir və kontekstinə tətbiq edir video nəsil. Video modellər daha sonra sürətli, yüksək keyfiyyətli nümunə götürmə üçün təsnifatçısız təlimatla mütərəqqi distillədən keçir.
Google tədqiqat komandası sistemin mətn təsvirini qəbul etdiyini iddia edir və 16 kadrlı film yaradır 24x48 piksel təsvir ölçüsü ilə saniyədə üç kadr. Sistem əlavə kadrları ölçür və "proqnozlaşdırır", saniyədə 128 kadr və 24p (720×1280) təsvir ölçüsündə 768 kadr ilə yekun video yaradır. Imagen Video-nu öyrətmək üçün 60 milyon şəkil-mətn cütü və 14 milyon video-mətn cütü istifadə edilmişdir.
Imagen Video nümunələri
Video çəkmək üçün süni intellektdən istifadə daha sürətli və daha ucuz olduğu üçün belə, şübhəsiz ki, bu cür texnologiyalar hər yerdə tətbiq olunacaq.
Daha çox oxumaq istəyirsiniz? Burada yoxlamaq üçün bəzi əlavə mövzular var:
Məsuliyyətdən imtina
uyğun olaraq Güvən Layihəsi qaydaları, lütfən nəzərə alın ki, bu səhifədə təqdim olunan məlumat hüquqi, vergi, investisiya, maliyyə və ya hər hansı digər məsləhət forması kimi təfsir edilməməlidir və təfsir edilməməlidir. Yalnız itirə biləcəyiniz şeyə investisiya qoymaq və hər hansı bir şübhəniz varsa, müstəqil maliyyə məsləhətləri axtarmaq vacibdir. Əlavə məlumat üçün biz emitent və ya reklamçı tərəfindən təmin edilən şərtlər və şərtlərə, həmçinin yardım və dəstək səhifələrinə müraciət etməyi təklif edirik. MetaversePost dəqiq, qərəzsiz hesabat verməyə sadiqdir, lakin bazar şərtləri xəbərdarlıq edilmədən dəyişdirilə bilər.
Müəllif haqqında
Damir komanda rəhbəri, məhsul meneceri və redaktordur Metaverse Post, AI/ML, AGI, LLMs, Metaverse və kimi mövzuları əhatə edir Web3- əlaqəli sahələr. Onun məqalələri hər ay bir milyondan çox istifadəçinin kütləsini cəlb edir. O, SEO və rəqəmsal marketinq sahəsində 10 illik təcrübəyə malik mütəxəssis kimi görünür. Damirin adı Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto və digər nəşrlər. O, rəqəmsal köçəri kimi BƏƏ, Türkiyə, Rusiya və MDB arasında səyahət edir. Damir fizika üzrə bakalavr dərəcəsi qazandı və onun fikrincə, bu, ona internetin daim dəyişən mənzərəsində uğur qazanmaq üçün lazım olan tənqidi düşünmə bacarıqlarını verdi.
Ətraflı məqalələrDamir komanda rəhbəri, məhsul meneceri və redaktordur Metaverse Post, AI/ML, AGI, LLMs, Metaverse və kimi mövzuları əhatə edir Web3- əlaqəli sahələr. Onun məqalələri hər ay bir milyondan çox istifadəçinin kütləsini cəlb edir. O, SEO və rəqəmsal marketinq sahəsində 10 illik təcrübəyə malik mütəxəssis kimi görünür. Damirin adı Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto və digər nəşrlər. O, rəqəmsal köçəri kimi BƏƏ, Türkiyə, Rusiya və MDB arasında səyahət edir. Damir fizika üzrə bakalavr dərəcəsi qazandı və onun fikrincə, bu, ona internetin daim dəyişən mənzərəsində uğur qazanmaq üçün lazım olan tənqidi düşünmə bacarıqlarını verdi.