Tudósítást
Október 06, 2022

A Google felülmúlja a Metát egy új szöveg-videó AI-generátor, Imagen Video elindításával 

Röviden

A Google Imagen Video megpróbálja segíteni a videogenerátort, hogy gyilkos alkalmazásokká váljon

Nem kellett sok idő, hogy a Google válaszoljon a Meta Make-a-Video-ra. A szöveges prompt használatával Képes videó fantasztikus videót készíthet. Az eredmények óriási előrelépést jelentenek a technika állásához képest, számos hátránya ellenére.

Összehasonlítva a Facebook Text-to-Video AI generátorával Csinálj egy videót, az eredmények észrevehetően jobbak. Ez a stratégia azonban nagyobb felügyeletet is igényelt. Ellentétben az Imagen Video-val, ahol a mikromunkások keményen dolgoztak, hogy írott leírásokkal kommentálják a filmeket, a Make-a-Scene felirat nélküli videókat használt a képzéshez.

Az építészet sajátosságaiba belemenni értelmetlen; érdemes olvasni a cikkben itt. Csak megerősíthetjük, hogy a T16 kódoló szövegbeágyazásából először 5 képkocka jön létre 48×24 felbontással, 3 képkocka/másodperc sebességgel, majd ezt számos diffúziós modell felskálázza a 128 képkockás végső filmbe. 1280×768 és 24 képkocka másodpercenként.

Mi az az Imagen Video?

Az Imagen Video egy módszer szöveges feltételes videók létrehozására, amelyek videodiffúziós modellek sorozatán alapulnak. Az Imagen Video kiváló minőségű filmeket készít szöveges felszólítások egy alap videógyártási modell és egy sor váltott soros térbeli és időbeli videó szuperfelbontású modell kombinálásával. Tekintse át a tervezési döntéseket hozó csapatot a rendszer bővítése közben.defiszöveg-videó modell, beleértve a diffúziós modellek v-paraméterezésére vonatkozó döntést, valamint a teljesen konvolúciós időbeli és térbeli szuperfelbontású modellek kiválasztását meghatározott felbontásokon. Ezenkívül érvényesíti és alkalmazza a diffúzió alapú képalkotással kapcsolatos korábbi munkák eredményeit a kontextusban videó generálás. A videomodelleket ezután fokozatos desztillációnak vetik alá osztályozó nélküli irányítással a gyors, kiváló minőségű mintavétel érdekében.

A Google kutatócsoportja azt állítja, hogy a rendszer elfogadja a szöveges leírást és 16 képkockás filmet generál másodpercenként három képkocka sebességgel, 24 x 48 pixeles felbontással. A rendszer méretezi és „megjósolja” a plusz képkockákat, így 128 képkockás, 24 képkocka/másodperc sebességű, 720p felbontású (1280×768) videót készít. 60 millió kép-szöveg pár van, és 14 millió videó-szöveg párt használtak az Imagen Video betanítására.

Imagen Video minták

Még akkor is, ha pusztán azért, mert a mesterséges intelligencia videókészítés gyorsabb és olcsóbb, az ilyen technológiákat kétségtelenül mindenhol alkalmazni fogják.

Érdekel többet olvasni? Íme néhány további téma, amelyet érdemes megnézni:

A felelősség megtagadása

Összhangban a A Trust Project irányelvei, kérjük, vegye figyelembe, hogy az ezen az oldalon közölt információk nem minősülnek jogi, adózási, befektetési, pénzügyi vagy bármilyen más formájú tanácsnak, és nem is értelmezhetők. Fontos, hogy csak annyit fektessen be, amennyit megengedhet magának, hogy elveszítsen, és kérjen független pénzügyi tanácsot, ha kétségei vannak. További információkért javasoljuk, hogy tekintse meg a szerződési feltételeket, valamint a kibocsátó vagy hirdető által biztosított súgó- és támogatási oldalakat. MetaversePost elkötelezett a pontos, elfogulatlan jelentéstétel mellett, de a piaci feltételek előzetes értesítés nélkül változhatnak.

A szerzőről

Damir a csapat vezetője, termékmenedzsere és szerkesztője Metaverse Post, olyan témákkal foglalkozik, mint az AI/ML, AGI, LLMs, Metaverse és Web3- kapcsolódó mezők. Cikkei havonta több mint egymillió felhasználót vonzanak. Úgy tűnik, szakértő, aki 10 éves tapasztalattal rendelkezik a SEO és a digitális marketing területén. Damirt a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto és más kiadványok. Digitális nomádként utazik az Egyesült Arab Emírségek, Törökország, Oroszország és a FÁK között. Damir fizikából szerzett bachelor-diplomát, és úgy gondolja, hogy ez megadta neki azokat a kritikus gondolkodási készségeket, amelyek szükségesek ahhoz, hogy sikeres legyen az internet folyamatosan változó táján. 

További cikkek
Damir Jalalov
Damir Jalalov

Damir a csapat vezetője, termékmenedzsere és szerkesztője Metaverse Post, olyan témákkal foglalkozik, mint az AI/ML, AGI, LLMs, Metaverse és Web3- kapcsolódó mezők. Cikkei havonta több mint egymillió felhasználót vonzanak. Úgy tűnik, szakértő, aki 10 éves tapasztalattal rendelkezik a SEO és a digitális marketing területén. Damirt a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto és más kiadványok. Digitális nomádként utazik az Egyesült Arab Emírségek, Törökország, Oroszország és a FÁK között. Damir fizikából szerzett bachelor-diplomát, és úgy gondolja, hogy ez megadta neki azokat a kritikus gondolkodási készségeket, amelyek szükségesek ahhoz, hogy sikeres legyen az internet folyamatosan változó táján. 

A DOGE Frenzy: A Dogecoin (DOGE) közelmúltbeli értéknövekedésének elemzése

A kriptovaluta ipar rohamosan bővül, a mémérmék pedig jelentős fellendülésre készülnek. Dogecoin (DOGE), ...

Tudjon meg többet

A mesterséges intelligencia által generált tartalom evolúciója a metaverzumban

A generatív AI-tartalom megjelenése az egyik leglenyűgözőbb fejlemény a virtuális környezetben...

Tudjon meg többet
Csatlakozzon innovatív technológiai közösségünkhöz
KATT ide
Tovább
A hét legjobb ajánlatai, jelentősebb befektetések az AI-ba, IT-be, Web3és Crypto (22-26.04)
megemészteni üzleti piacok Technológia
A hét legjobb ajánlatai, jelentősebb befektetések az AI-ba, IT-be, Web3és Crypto (22-26.04)
April 26, 2024
Vitalik Buterin megjegyzéseket fűzött a PoW központosításához, megjegyzi, hogy az ideiglenes szakasz volt a PoS-ig
Tudósítást Technológia
Vitalik Buterin megjegyzéseket fűzött a PoW központosításához, megjegyzi, hogy az ideiglenes szakasz volt a PoS-ig
April 26, 2024
Az Offchain Labs két kritikus sebezhetőséget tárt fel az Optimism OP Stack csalási bizonyítékaiban
Tudósítást szoftver Technológia
Az Offchain Labs két kritikus sebezhetőséget tárt fel az Optimism OP Stack csalási bizonyítékaiban
April 26, 2024
Megjelent a Dymension nyílt piaca a RollApps eIBC likviditásának áthidalására a központi hálózaton
Tudósítást Technológia
Megjelent a Dymension nyílt piaca a RollApps eIBC likviditásának áthidalására a központi hálózaton 
April 26, 2024
CRYPTOMERIA LABS PTE. KFT.