Ziņojums
Oktobris 06, 2022

Google pārvar meta, ieviešot jaunu teksta-video AI ģeneratoru, Imagen Video 

Īsumā

Google Imagen Video mēģina palīdzēt video ģeneratoram pārvērsties par slepkavām lietotnēm

Nepagāja ilgs laiks, līdz Google atbildēja uz Meta uzziņu Make-a-Video. Izmantojot teksta uzvedni, Attēlu video var izveidot fantastisku video. Rezultāti ir milzīgs sasniegums pāri tehnikas līmenim, neskatoties uz vairākiem trūkumiem.

Salīdzinājumā ar Facebook teksta-video AI ģeneratoru Izveidot video, rezultāti ir ievērojami labāki. Tomēr šī stratēģija prasīja arī lielāku uzraudzību. Atšķirībā no Imagen Video, kur mikro darbinieki smagi strādāja, lai anotētu filmas ar rakstiskiem aprakstiem, Make-a-Scene apmācībās izmantoja videoklipus bez etiķetēm.

Iedziļināties arhitektūras specifikā ir bezjēdzīgi; par to jums vajadzētu izlasīt rakstā šeit. Mēs varam tikai apstiprināt, ka no T16 kodētāja teksta iegulšanas vispirms tiek ģenerēti 5 kadri ar izšķirtspēju 48 × 24 ar 3 kadriem sekundē, un pēc tam tos palielina ar vairākiem difūzijas modeļiem galīgajā filmā ar 128 kadriem. 1280 × 768 un 24 kadri sekundē.

Kas ir Imagen Video?

Imagen Video ir metode teksta nosacījumu videoklipu izveidei, pamatojoties uz virkni video difūzijas modeļu. Imagen Video ražo augstas kvalitātes filmas no teksta uzvednes apvienojot pamata video veidošanas modeli ar virkni savstarpēji savienotu telpisko un laika video superizšķirtspējas modeļu. Pārskatiet dizaina izvēli, ko veica komanda, palielinot sistēmu kā augsta līmeņadefiteksta pārveides modelis, tostarp lēmums par difūzijas modeļu v-parametrizēšanu un pilnībā konvolucionālu laika un telpiskās superizšķirtspējas modeļu atlase noteiktās izšķirtspējās. Turklāt tas apstiprina un kontekstā izmanto rezultātus, kas iegūti no agrākā darba pie difūzijas bāzes attēlu veidošanas video ģenerēšana. Pēc tam video modeļi tiek pakļauti progresīvai destilācijai, izmantojot bez klasifikatora vadību ātrai, augstas kvalitātes paraugu ņemšanai.

Google pētnieku komanda apgalvo, ka sistēma pieņem teksta aprakstu un ģenerē 16 kadru filmu ar trīs kadriem sekundē ar izšķirtspēju 24x48 pikseļi. Sistēma mērogo un "paredz" papildu kadrus, izveidojot galīgo video ar 128 kadriem ar ātrumu 24 kadri sekundē un 720p izšķirtspēju (1280 × 768). Ir 60 miljoni attēla un teksta pāru, un 14 miljoni video un teksta pāru tika izmantoti Imagen Video apmācībai.

Attēlu video paraugi

Pat ja AI izmantošana video veidošanai ir ātrāka un lētāka, šādas tehnoloģijas neapšaubāmi tiks izmantotas visur.

Vai vēlaties lasīt vairāk? Šeit ir dažas papildu tēmas, kas jāpārbauda:

Atbildības noraidīšana

Atbilstīgi Uzticības projekta vadlīnijas, lūdzu, ņemiet vērā, ka šajā lapā sniegtā informācija nav paredzēta un to nedrīkst interpretēt kā juridisku, nodokļu, ieguldījumu, finanšu vai jebkāda cita veida padomu. Ir svarīgi ieguldīt tikai to, ko varat atļauties zaudēt, un meklēt neatkarīgu finanšu padomu, ja jums ir šaubas. Lai iegūtu papildinformāciju, iesakām skatīt pakalpojumu sniegšanas noteikumus, kā arī palīdzības un atbalsta lapas, ko nodrošina izdevējs vai reklāmdevējs. MetaversePost ir apņēmies sniegt precīzus, objektīvus pārskatus, taču tirgus apstākļi var tikt mainīti bez iepriekšēja brīdinājuma.

Par Autors

Damirs ir komandas vadītājs, produktu vadītājs un redaktors Metaverse Post, kas aptver tādas tēmas kā AI/ML, AGI, LLM, Metaverse un Web3- saistītie lauki. Viņa raksti katru mēnesi piesaista lielu auditoriju, kas pārsniedz miljonu lietotāju. Šķiet, ka viņš ir eksperts ar 10 gadu pieredzi SEO un digitālā mārketinga jomā. Damirs ir minēts Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto un citas publikācijas. Viņš ceļo starp AAE, Turciju, Krieviju un NVS kā digitālais nomads. Damirs ir ieguvis bakalaura grādu fizikā, kas, viņaprāt, ir devis viņam kritiskās domāšanas prasmes, kas nepieciešamas, lai gūtu panākumus nepārtraukti mainīgajā interneta vidē. 

Vairāk rakstus
Damirs Jalalovs
Damirs Jalalovs

Damirs ir komandas vadītājs, produktu vadītājs un redaktors Metaverse Post, kas aptver tādas tēmas kā AI/ML, AGI, LLM, Metaverse un Web3- saistītie lauki. Viņa raksti katru mēnesi piesaista lielu auditoriju, kas pārsniedz miljonu lietotāju. Šķiet, ka viņš ir eksperts ar 10 gadu pieredzi SEO un digitālā mārketinga jomā. Damirs ir minēts Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto un citas publikācijas. Viņš ceļo starp AAE, Turciju, Krieviju un NVS kā digitālais nomads. Damirs ir ieguvis bakalaura grādu fizikā, kas, viņaprāt, ir devis viņam kritiskās domāšanas prasmes, kas nepieciešamas, lai gūtu panākumus nepārtraukti mainīgajā interneta vidē. 

Hot Stories
Pievienojieties mūsu informatīvajam izdevumam.
Jaunākās ziņas

DOGE Frenzy: analizējot Dogecoin (DOGE) neseno vērtības pieaugumu

Kriptovalūtu industrija strauji paplašinās, un mēmu monētas gatavojas ievērojamam augšupejam. Dogecoin (DOGE), ...

Uzziniet vairāk

AI radītā satura evolūcija metaversā

Ģeneratīvā AI satura parādīšanās ir viens no aizraujošākajiem notikumiem virtuālajā vidē ...

Uzziniet vairāk
Pievienojieties mūsu novatoriskajai tehnoloģiju kopienai
Lasīt vairāk
Vairāk
Tiger Brokers sāks nulles komisijas maksas tirdzniecību Bosera HashKey, China Asset Management un Harvest Spot kriptovalūtu ETF
bizness Markets Ziņojums
Tiger Brokers sāks nulles komisijas maksas tirdzniecību Bosera HashKey, China Asset Management un Harvest Spot kriptovalūtu ETF
Aprīlis 29, 2024
Scroll pabeidz Bernulli Mainnet jaunināšanu, paredz 10x darījumu izmaksu samazināšanos
Ziņojums Tehnoloģija
Scroll pabeidz Bernulli Mainnet jaunināšanu, paredz 10x darījumu izmaksu samazināšanos
Aprīlis 29, 2024
OKX Jumpstart sarakstu Runecoin, ļauj BTC Staking, lai nopelnītu RUNE žetonus
Markets Ziņojums Tehnoloģija
OKX Jumpstart sarakstu Runecoin, ļauj BTC Staking, lai nopelnītu RUNE žetonus
Aprīlis 29, 2024
Šīs nedēļas labākie piedāvājumi, lielie ieguldījumi AI, IT, Web3un Kripto (22-26.04)
Sagremot bizness Markets Tehnoloģija
Šīs nedēļas labākie piedāvājumi, lielie ieguldījumi AI, IT, Web3un Kripto (22-26.04)
Aprīlis 26, 2024
CRYPTOMERIA LABS PTE. LTD.