Google pārvar meta, ieviešot jaunu teksta-video AI ģeneratoru, Imagen Video
Īsumā
Google Imagen Video mēģina palīdzēt video ģeneratoram pārvērsties par slepkavām lietotnēm
Nepagāja ilgs laiks, līdz Google atbildēja uz Meta uzziņu Make-a-Video. Izmantojot teksta uzvedni, Attēlu video var izveidot fantastisku video. Rezultāti ir milzīgs sasniegums pāri tehnikas līmenim, neskatoties uz vairākiem trūkumiem.
Salīdzinājumā ar Facebook teksta-video AI ģeneratoru Izveidot video, rezultāti ir ievērojami labāki. Tomēr šī stratēģija prasīja arī lielāku uzraudzību. Atšķirībā no Imagen Video, kur mikro darbinieki smagi strādāja, lai anotētu filmas ar rakstiskiem aprakstiem, Make-a-Scene apmācībās izmantoja videoklipus bez etiķetēm.
Iedziļināties arhitektūras specifikā ir bezjēdzīgi; par to jums vajadzētu izlasīt rakstā šeit. Mēs varam tikai apstiprināt, ka no T16 kodētāja teksta iegulšanas vispirms tiek ģenerēti 5 kadri ar izšķirtspēju 48 × 24 ar 3 kadriem sekundē, un pēc tam tos palielina ar vairākiem difūzijas modeļiem galīgajā filmā ar 128 kadriem. 1280 × 768 un 24 kadri sekundē.
Kas ir Imagen Video?
Imagen Video ir metode teksta nosacījumu videoklipu izveidei, pamatojoties uz virkni video difūzijas modeļu. Imagen Video ražo augstas kvalitātes filmas no teksta uzvednes apvienojot pamata video veidošanas modeli ar virkni savstarpēji savienotu telpisko un laika video superizšķirtspējas modeļu. Pārskatiet dizaina izvēli, ko veica komanda, palielinot sistēmu kā augsta līmeņadefiteksta pārveides modelis, tostarp lēmums par difūzijas modeļu v-parametrizēšanu un pilnībā konvolucionālu laika un telpiskās superizšķirtspējas modeļu atlase noteiktās izšķirtspējās. Turklāt tas apstiprina un kontekstā izmanto rezultātus, kas iegūti no agrākā darba pie difūzijas bāzes attēlu veidošanas video ģenerēšana. Pēc tam video modeļi tiek pakļauti progresīvai destilācijai, izmantojot bez klasifikatora vadību ātrai, augstas kvalitātes paraugu ņemšanai.
Google pētnieku komanda apgalvo, ka sistēma pieņem teksta aprakstu un ģenerē 16 kadru filmu ar trīs kadriem sekundē ar izšķirtspēju 24x48 pikseļi. Sistēma mērogo un "paredz" papildu kadrus, izveidojot galīgo video ar 128 kadriem ar ātrumu 24 kadri sekundē un 720p izšķirtspēju (1280 × 768). Ir 60 miljoni attēla un teksta pāru, un 14 miljoni video un teksta pāru tika izmantoti Imagen Video apmācībai.
Attēlu video paraugi
Pat ja AI izmantošana video veidošanai ir ātrāka un lētāka, šādas tehnoloģijas neapšaubāmi tiks izmantotas visur.
Vai vēlaties lasīt vairāk? Šeit ir dažas papildu tēmas, kas jāpārbauda:
Atbildības noraidīšana
Atbilstīgi Uzticības projekta vadlīnijas, lūdzu, ņemiet vērā, ka šajā lapā sniegtā informācija nav paredzēta un to nedrīkst interpretēt kā juridisku, nodokļu, ieguldījumu, finanšu vai jebkāda cita veida padomu. Ir svarīgi ieguldīt tikai to, ko varat atļauties zaudēt, un meklēt neatkarīgu finanšu padomu, ja jums ir šaubas. Lai iegūtu papildinformāciju, iesakām skatīt pakalpojumu sniegšanas noteikumus, kā arī palīdzības un atbalsta lapas, ko nodrošina izdevējs vai reklāmdevējs. MetaversePost ir apņēmies sniegt precīzus, objektīvus pārskatus, taču tirgus apstākļi var tikt mainīti bez iepriekšēja brīdinājuma.
Par Autors
Damirs ir komandas vadītājs, produktu vadītājs un redaktors Metaverse Post, kas aptver tādas tēmas kā AI/ML, AGI, LLM, Metaverse un Web3- saistītie lauki. Viņa raksti katru mēnesi piesaista lielu auditoriju, kas pārsniedz miljonu lietotāju. Šķiet, ka viņš ir eksperts ar 10 gadu pieredzi SEO un digitālā mārketinga jomā. Damirs ir minēts Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto un citas publikācijas. Viņš ceļo starp AAE, Turciju, Krieviju un NVS kā digitālais nomads. Damirs ir ieguvis bakalaura grādu fizikā, kas, viņaprāt, ir devis viņam kritiskās domāšanas prasmes, kas nepieciešamas, lai gūtu panākumus nepārtraukti mainīgajā interneta vidē.
Vairāk rakstusDamirs ir komandas vadītājs, produktu vadītājs un redaktors Metaverse Post, kas aptver tādas tēmas kā AI/ML, AGI, LLM, Metaverse un Web3- saistītie lauki. Viņa raksti katru mēnesi piesaista lielu auditoriju, kas pārsniedz miljonu lietotāju. Šķiet, ka viņš ir eksperts ar 10 gadu pieredzi SEO un digitālā mārketinga jomā. Damirs ir minēts Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto un citas publikācijas. Viņš ceļo starp AAE, Turciju, Krieviju un NVS kā digitālais nomads. Damirs ir ieguvis bakalaura grādu fizikā, kas, viņaprāt, ir devis viņam kritiskās domāšanas prasmes, kas nepieciešamas, lai gūtu panākumus nepārtraukti mainīgajā interneta vidē.