Ulat sa Balita
Oktubre 06, 2022

Nagtagumpay ang Google sa Meta sa pamamagitan ng Paglulunsad ng Bagong Text-to-Video AI Generator, Imagen Video 

Sa madaling sabi

Sinusubukan ng Imagen Video ng Google na tulungan ang video-generator na maging mga nakakapatay na app

Hindi nagtagal bago tumugon ang Google sa Make-a-Video mula sa Meta. Sa pamamagitan ng paggamit ng text prompt, Video ng Larawan maaaring makagawa ng isang kamangha-manghang video. Ang mga resulta ay isang napakalaking pagsulong sa itaas ng estado ng sining sa kabila ng isang bilang ng mga drawbacks.

Sa paghahambing sa Text-to-Video AI generator ng Facebook Gumawa-isang-Video, ang mga resulta ay kapansin-pansing mas mahusay. Gayunpaman, ang diskarte na ito ay nangangailangan din ng higit na pangangasiwa. Sa kaibahan sa Imagen Video, kung saan nagsikap ang mga micro worker na i-annotate ang mga pelikulang may nakasulat na paglalarawan, gumamit ang Make-a-Scene ng mga video na walang label para sa pagsasanay.

Ang pagpunta sa mga detalye ng arkitektura ay walang kabuluhan; dapat mong basahin ang tungkol dito sa artikulo dito. Makukumpirma lang namin na 16 na frame ang unang nabuo mula sa text embedding ng T5 encoder sa isang resolution na 48×24 na may 3 frame sa bawat segundo, at na ito ay pinapataas ng bilang ng mga diffusion model sa huling pelikula ng 128 na frame sa 1280 × 768 at 24 na mga frame bawat segundo.

Ano ang Imagen Video?

Ang Imagen Video ay isang paraan para sa paglikha ng mga text-conditional na video batay sa isang serye ng mga modelo ng video diffusion. Ang Imagen Video ay gumagawa ng mga de-kalidad na pelikula mula sa mga text prompt sa pamamagitan ng pagsasama-sama ng isang batayang modelo ng produksyon ng video sa isang serye ng mga interlaced na spatial at temporal na modelo ng super-resolution ng video. Suriin ang koponan ng mga pagpipilian sa disenyo na ginawa habang pinapalaki ang system bilang isang mataas nadefinition text-to-video na modelo, kabilang ang desisyon na i-parameterize ang mga modelo ng diffusion at ang pagpili ng ganap na convolutional temporal at spatial na super-resolution na mga modelo sa mga partikular na resolution. Bilang karagdagan, ito ay nagpapatunay at naglalapat ng mga resulta mula sa naunang trabaho sa diffusion-based na paggawa ng imahe sa konteksto ng pagbuo ng video. Ang mga modelo ng video ay sasailalim sa progresibong distillation na may gabay na walang classifier para sa mabilis at mataas na kalidad na sampling.

Sinasabi ng pangkat ng pananaliksik ng Google na ang system ay tumatanggap ng isang tekstuwal na paglalarawan at bumubuo ng 16-frame na pelikula sa tatlong frame bawat segundo na may resolution na 24 by 48 pixels. Ang system ay nagsusukat at "naghuhula" ng mga karagdagang frame, na gumagawa ng panghuling video na may 128 mga frame sa 24 na mga frame bawat segundo at 720p na resolusyon (1280 × 768). Mayroong 60 milyong mga pares ng imahe-text at 14 na milyong mga pares ng video-text ang ginamit upang sanayin ang Imagen Video.

Mga Sample ng Imagen Video

Kahit na dahil lamang sa paggamit ng AI upang gumawa ng video ay mas mabilis at mas mura, ang mga naturang teknolohiya ay walang alinlangan na gagamitin sa lahat ng dako.

Interesado sa pagbabasa ng higit pa? Narito ang ilang karagdagang paksa upang tingnan:

Pagtanggi sa pananagutan

Sa linya na may Mga alituntunin ng Trust Project, pakitandaan na ang impormasyong ibinigay sa pahinang ito ay hindi nilayon at hindi dapat bigyang-kahulugan bilang legal, buwis, pamumuhunan, pananalapi, o anumang iba pang paraan ng payo. Mahalagang mamuhunan lamang kung ano ang maaari mong mawala at humingi ng independiyenteng payo sa pananalapi kung mayroon kang anumang mga pagdududa. Para sa karagdagang impormasyon, iminumungkahi naming sumangguni sa mga tuntunin at kundisyon pati na rin sa mga pahina ng tulong at suporta na ibinigay ng nagbigay o advertiser. MetaversePost ay nakatuon sa tumpak, walang pinapanigan na pag-uulat, ngunit ang mga kondisyon ng merkado ay maaaring magbago nang walang abiso.

Tungkol sa Ang May-akda

Si Damir ang pinuno ng pangkat, tagapamahala ng produkto, at editor sa Metaverse Post, sumasaklaw sa mga paksa gaya ng AI/ML, AGI, LLMs, Metaverse, at Web3-mga kaugnay na larangan. Ang kanyang mga artikulo ay umaakit ng napakalaking madla na mahigit sa isang milyong user bawat buwan. Mukhang isa siyang eksperto na may 10 taong karanasan sa SEO at digital marketing. Nabanggit si Damir sa Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, at iba pang publikasyon. Naglalakbay siya sa pagitan ng UAE, Turkey, Russia, at ng CIS bilang digital nomad. Nakamit ni Damir ang bachelor's degree sa physics, na pinaniniwalaan niyang nagbigay sa kanya ng mga kritikal na kasanayan sa pag-iisip na kailangan para maging matagumpay sa pabago-bagong tanawin ng internet. 

Mas marami pang artikulo
Damir Yalalov
Damir Yalalov

Si Damir ang pinuno ng pangkat, tagapamahala ng produkto, at editor sa Metaverse Post, sumasaklaw sa mga paksa gaya ng AI/ML, AGI, LLMs, Metaverse, at Web3-mga kaugnay na larangan. Ang kanyang mga artikulo ay umaakit ng napakalaking madla na mahigit sa isang milyong user bawat buwan. Mukhang isa siyang eksperto na may 10 taong karanasan sa SEO at digital marketing. Nabanggit si Damir sa Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, at iba pang publikasyon. Naglalakbay siya sa pagitan ng UAE, Turkey, Russia, at ng CIS bilang digital nomad. Nakamit ni Damir ang bachelor's degree sa physics, na pinaniniwalaan niyang nagbigay sa kanya ng mga kritikal na kasanayan sa pag-iisip na kailangan para maging matagumpay sa pabago-bagong tanawin ng internet. 

The DOGE Frenzy: Pagsusuri sa Kamakailang Pagtaas ng Halaga ng Dogecoin (DOGE).

Ang industriya ng cryptocurrency ay mabilis na lumalawak, at ang mga meme coins ay naghahanda para sa isang makabuluhang pagtaas. Dogecoin (DOGE), ...

Malaman Higit Pa

Ang Ebolusyon ng AI-Generated Content sa Metaverse

Ang paglitaw ng generative na nilalaman ng AI ay isa sa mga pinaka-kamangha-manghang pag-unlad sa loob ng virtual na kapaligiran ...

Malaman Higit Pa
Sumali sa Aming Innovative Tech Community
Magbasa Pa
Magbasa nang higit pa
Tiger Brokers Upang Ilunsad ang Zero-Commission Trading Para sa Bosera HashKey, China Asset Management, At Harvest Spot Crypto ETFs
Negosyo markets Ulat sa Balita
Tiger Brokers Upang Ilunsad ang Zero-Commission Trading Para sa Bosera HashKey, China Asset Management, At Harvest Spot Crypto ETFs
Abril 29, 2024
Nakumpleto ng Scroll ang Bernoulli Mainnet Upgrade, Inaasahan ang 10x na Pagbawas sa Mga Gastos sa Transaksyon
Ulat sa Balita Teknolohiya
Nakumpleto ng Scroll ang Bernoulli Mainnet Upgrade, Inaasahan ang 10x na Pagbawas sa Mga Gastos sa Transaksyon
Abril 29, 2024
Ang OKX Jumpstart ay Naglilista ng Runecoin, Nagbibigay-daan sa BTC Staking Upang Makakuha ng RUNE Token
markets Ulat sa Balita Teknolohiya
Ang OKX Jumpstart ay Naglilista ng Runecoin, Nagbibigay-daan sa BTC Staking Upang Makakuha ng RUNE Token
Abril 29, 2024
Mga Nangungunang Deal ngayong Linggo, Mga Pangunahing Pamumuhunan sa AI, IT, Web3, at Crypto (22-26.04)
Digest Negosyo markets Teknolohiya
Mga Nangungunang Deal ngayong Linggo, Mga Pangunahing Pamumuhunan sa AI, IT, Web3, at Crypto (22-26.04)
Abril 26, 2024
CRYPTOMERIA LABS PTE. LTD.