Naujienų ataskaita
Spalis 06, 2022

„Google“ įveikia meta, paleisdama naują teksto į vaizdo įrašą AI generatorių, „Imagen Video“ 

Trumpai

„Google Imagen Video“ bando padėti vaizdo įrašų generatoriui paversti žudikiškomis programomis

Neilgai trukus „Google“ atsakė į „Meta“ „Make-a-Video“. Naudodami teksto raginimą, Vaizdo įrašas gali sukurti fantastišką vaizdo įrašą. Rezultatai yra didžiulis pažanga virš technikos lygio, nepaisant daugybės trūkumų.

Palyginti su „Facebook“ teksto į vaizdo AI generatoriumi Sukurti vaizdo įrašą, rezultatai pastebimai geresni. Tačiau ši strategija taip pat reikalavo daugiau priežiūros. Priešingai nei „Imagen Video“, kur mikro darbuotojai sunkiai dirbo, kad komentuotų filmus rašytiniais aprašymais, „Make-a-Scene“ mokymams naudojo nepažymėtus vaizdo įrašus.

Gilintis į architektūros specifiką beprasmiška; apie tai turėtumėte perskaityti straipsnyje čia. Galime tik patvirtinti, kad iš T16 koduotuvo teksto įdėjimo pirmiausia sugeneruojama 5 kadrų 48 × 24 raiška ir 3 kadrai per sekundę, o vėliau tai padidinama daugybe difuzijos modelių į galutinį 128 kadrų filmą. 1280 × 768 ir 24 kadrai per sekundę.

Kas yra vaizdo įrašas?

„Imagen Video“ yra sąlyginių tekstinių vaizdo įrašų kūrimo metodas, pagrįstas vaizdo sklaidos modelių serija. „Imagen Video“ kuria aukštos kokybės filmus iš tekstinius raginimus derinant pagrindinį vaizdo įrašų gamybos modelį su susipynusių erdvinių ir laiko vaizdo itin didelės raiškos modelių serija. Peržiūrėkite dizaino pasirinkimų komandą, kurią pasirinko didindami sistemos mastelį kaip aukšto lygiodefiteksto į vaizdo įrašą modelis, įskaitant sprendimą v-parametrizuoti difuzijos modelius ir visiškai konvoliucinių laiko ir erdvinių didelės raiškos modelių parinkimą tam tikromis raiškomis. Be to, ji patvirtina ir taiko ankstesnio darbo, gauto difuzija pagrįsto vaizdo kūrimo srityje, rezultatus vaizdo įrašų generavimas. Tada vaizdo modeliai laipsniškai distiliuojami, naudojant be klasifikatoriaus nurodymus, kad būtų galima greitai ir kokybiškai paimti mėginius.

Google tyrimų komanda teigia, kad sistema priima tekstinį aprašymą ir sukuria 16 kadrų filmą trijų kadrų per sekundę greičiu, o skiriamoji geba yra 24 x 48 pikseliai. Sistema keičia ir „numato“ papildomus kadrus, sukurdama galutinį vaizdo įrašą su 128 kadrais 24 kadrų per sekundę greičiu ir 720p raiška (1280 × 768). Yra 60 milijonų vaizdo ir teksto porų, o 14 milijonų vaizdo ir teksto porų buvo panaudota treniruoti Imagen Video.

Vaizdo įrašų pavyzdžiai

Net jei tik todėl, kad dirbtinio intelekto naudojimas vaizdo įrašams kurti yra greitesnis ir pigesnis, tokios technologijos neabejotinai bus naudojamos visur.

Domina skaityti daugiau? Čia yra keletas papildomų temų, kurias reikia patikrinti:

Atsakomybės neigimas

Remdamasi tuo, Pasitikėjimo projekto gairės, atkreipkite dėmesį, kad šiame puslapyje pateikta informacija nėra skirta ir neturėtų būti aiškinama kaip teisinė, mokesčių, investicinė, finansinė ar bet kokia kita konsultacija. Svarbu investuoti tik tai, ką galite sau leisti prarasti, ir, jei turite kokių nors abejonių, kreiptis į nepriklausomą finansinę konsultaciją. Norėdami gauti daugiau informacijos, siūlome peržiūrėti taisykles ir nuostatas bei pagalbos ir palaikymo puslapius, kuriuos pateikia išdavėjas arba reklamuotojas. MetaversePost yra įsipareigojusi teikti tikslias, nešališkas ataskaitas, tačiau rinkos sąlygos gali keistis be įspėjimo.

Apie autorių

Damiras yra komandos vadovas, produktų vadovas ir redaktorius Metaverse Post, apimantis tokias temas kaip AI/ML, AGI, LLM, Metaverse ir Web3– susijusiose srityse. Jo straipsniai kas mėnesį pritraukia didžiulę daugiau nei milijono vartotojų auditoriją. Atrodo, kad jis yra ekspertas, turintis 10 metų SEO ir skaitmeninės rinkodaros patirtį. Damiras buvo paminėtas Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ir kiti leidiniai. Jis keliauja tarp JAE, Turkijos, Rusijos ir NVS kaip skaitmeninis klajoklis. Damiras įgijo fizikos bakalauro laipsnį, kuris, jo manymu, suteikė jam kritinio mąstymo įgūdžių, reikalingų sėkmingam nuolat besikeičiančiame interneto peizaže. 

Daugiau straipsnių
Damiras Jalalovas
Damiras Jalalovas

Damiras yra komandos vadovas, produktų vadovas ir redaktorius Metaverse Post, apimantis tokias temas kaip AI/ML, AGI, LLM, Metaverse ir Web3– susijusiose srityse. Jo straipsniai kas mėnesį pritraukia didžiulę daugiau nei milijono vartotojų auditoriją. Atrodo, kad jis yra ekspertas, turintis 10 metų SEO ir skaitmeninės rinkodaros patirtį. Damiras buvo paminėtas Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ir kiti leidiniai. Jis keliauja tarp JAE, Turkijos, Rusijos ir NVS kaip skaitmeninis klajoklis. Damiras įgijo fizikos bakalauro laipsnį, kuris, jo manymu, suteikė jam kritinio mąstymo įgūdžių, reikalingų sėkmingam nuolat besikeičiančiame interneto peizaže. 

„DOGE Frenzy“: „Dogecoin“ (DOGE) pastarojo meto vertės padidėjimo analizė

Kriptovaliutų pramonė sparčiai plečiasi, o memų monetos ruošiasi reikšmingam pakilimui. Dogecoin (DOGE), ...

Žinoti daugiau

Dirbtinio intelekto sukurto turinio raida metaverse

Generatyvaus dirbtinio intelekto turinio atsiradimas yra vienas įspūdingiausių įvykių virtualioje aplinkoje...

Žinoti daugiau
Prisijunkite prie mūsų naujoviškų technologijų bendruomenės
Skaityti daugiau
Skaityti daugiau
„Tiger Brokers“ pradės prekybą be komisinių „Bosera HashKey“, „China Asset Management“ ir „Harvest Spot“ kriptovaliutų ETF
Atsakingas verslas rinkos Naujienų ataskaita
„Tiger Brokers“ pradės prekybą be komisinių „Bosera HashKey“, „China Asset Management“ ir „Harvest Spot“ kriptovaliutų ETF
Balandis 29, 2024
„Scroll“ užbaigia „Bernoulli Mainnet“ atnaujinimą, tikisi 10 kartų sumažinti sandorių išlaidas
Naujienų ataskaita Technologija
„Scroll“ užbaigia „Bernoulli Mainnet“ atnaujinimą, tikisi 10 kartų sumažinti sandorių išlaidas
Balandis 29, 2024
OKX „Jumpstart“ išvardija „Runecoin“, leidžia „BTC Staking“ uždirbti RUNE žetonus
rinkos Naujienų ataskaita Technologija
OKX „Jumpstart“ išvardija „Runecoin“, leidžia „BTC Staking“ uždirbti RUNE žetonus
Balandis 29, 2024
Šios savaitės geriausi pasiūlymai, didelės investicijos į AI, IT, Web3ir kriptovaliuta (22–26.04)
Virškinimas Atsakingas verslas rinkos Technologija
Šios savaitės geriausi pasiūlymai, didelės investicijos į AI, IT, Web3ir kriptovaliuta (22–26.04)
Balandis 26, 2024
CRYPTOMERIA LABS PTE. LTD.