Ulat sa Balita Teknolohiya
Pebrero 08, 2023

Gen-1: Bumuo ang AI ng Mga Bagong Video Mula sa Mga Umiiral sa pamamagitan ng Pagsasama-sama ng Mga Prompt at Mga Larawan

Sa madaling sabi

Ang Gen-1 ay isang neural network na maaaring makabuo ng mga bagong video mula sa mga dati nang video sa pamamagitan ng pagsasama-sama mga senyas at mga larawan.

Maaari rin itong magamit upang lumikha ng ganap na bagong mga video mula sa simula.

Ang kakayahang makabuo ng mga bagong video mula sa mga umiiral na ay may bilang ng mga potensyal na application.

RunWayML, isang artificial intelligence startup, ay inihayag isang bagong produkto na tinatawag na Gen-1, isang neural network na maaaring makabuo ng mga bagong video mula sa mga umiiral na sa pamamagitan ng pagsasama-sama ng mga prompt at larawan. Sa loob ng maraming taon, ang mga neural network ay limitado sa gawain ng paglipat ng istilo, na kung saan ay ang proseso ng pagkuha ng isang imahe at paglalapat ng estilo ng isa pang imahe dito. Ito ay kung paano namin nakukuha ang mga trippy na deep-learning na mga video na paglilipat ng istilo kung saan, halimbawa, isang landscape ay na-render sa istilo ng Starry Night ni Van Gogh.

Gen-1: Bumubuo ang AI ng mga bagong video mula sa mga dati nang video sa pamamagitan ng pagsasama-sama ng mga prompt at larawan
@Midjourney / Ang Kakaibang Multo

Ngayon, sa Gen-1, higit pa sa paglipat ng istilo ang magagawa ng mga neural network. Maaari itong bumuo ng mga bagong video mula sa simula, gamit ang mga senyas at larawan bilang input. Nagbubukas ito ng isang buong bagong hanay ng mga posibilidad para sa Mga video na nilikha ng AI. Sa ngayon, ang mga video na nabuo ng Gen-1 ay maikli at simple. Ngunit habang umuunlad ang teknolohiya, maaari nating asahan na makakita ng mas kumplikado at makatotohanang mga video na binuo ng AI.

Inirerekomendang post: Ang kalusugan ng reproduktibo ng mga lalaki ay napabuti sa pamamagitan ng panonood ng mga pang-adultong video sa virtual reality

Ano ang Gen-1?

Ang malakas na mga tool sa paggawa at pag-edit ng larawan ay na-unlock ng text-guided mga modelo ng generative diffusion. Habang ang mga ito ay inilapat sa paglikha ng mga video, ang kasalukuyang mga pamamaraan para sa pag-edit ng nilalaman ng umiiral nang materyal habang pinapanatili ang istraktura nito ay nangangailangan ng mamahaling muling pagsasanay para sa bawat input o nakadepende sa peligrosong pagpapalaganap ng mga pagbabago sa larawan sa pagitan ng mga frame.

Ang mga developer ay naglalarawan ng isang modelo para sa structure- at content-guided video diffusion, na nagbabago ng mga pelikula batay sa alinman sa nakasulat o visual na paglalarawan ng nais na resulta. Dahil sa hindi sapat na pag-decoupling, lumilitaw ang mga salungatan sa pagitan ng mga pagbabago sa content na ibinigay ng user at mga representasyon ng istruktura. Ipinakikita nila na ang istruktura at integridad ng nilalaman ay maaaring kontrolin ng pagsasanay sa mga monocular depth na pagtatantya na may iba't ibang antas ng detalye.

Mag-synthesize ng mga bagong video sa isang makatotohanan at pare-parehong paraan sa pamamagitan ng paglalapat ng komposisyon at istilo ng isang larawan o text prompt sa istruktura ng iyong pinagmulang video. Ito ay tulad ng paggawa ng pelikula ng isang bagay na bago nang hindi aktwal na kinukunan ng anuman.

Ang pag-synthesize ng isang bagong video gamit ang paraang ito ay nagbibigay-daan sa mga gumagawa ng pelikula na mabilis na makagawa ng nilalaman sa isang cost-effective na paraan
Ang pag-synthesize ng isang bagong video gamit ang paraang ito ay nagbibigay-daan sa mga gumagawa ng pelikula na mabilis na makagawa ng nilalaman sa isang cost-effective na paraan

Ang paglilipat ng istilo ng isang imahe o prompt sa bawat frame ng isang video ay maaaring maging isang mahusay na paraan upang pag-isahin ang iyong proyekto, bigyan ito ng isang pangkalahatang visual na tema, at lumikha ng pagkakapare-pareho.

Sa pamamagitan ng paggamit ng software at malikhaing disenyo, ang mga mockup ay maaaring gawing aesthetically pleasing at interactive na mga render na nagbibigay-buhay sa paningin ng user.

Ang mga mockup ay nagbibigay-daan sa mga taga-disenyo na mailarawan ang kanilang mga ideya at lumikha ng mga nakikitang resulta na maaaring iharap para sa pagsusuri
Ang mga mockup ay nagbibigay-daan sa mga taga-disenyo na mailarawan ang kanilang mga ideya at lumikha ng mga nakikitang resulta na maaaring iharap para sa pagsusuri

Sa mga feature sa pag-edit ng video, madaling ihiwalay ang mga bahagi ng isang video at pagandahin ang mga ito gamit ang mga text prompt.

Paglalapat ng input na imahe o prompt sa mga untextured na render ay maaaring lubos na mapahusay ang kanilang pagiging totoo, na nagbibigay-buhay sa mga 3D na modelo.

Ang Runway Research ay nakatuon sa pagbuo ng multimodal AI system na nagbibigay-daan sa mga bagong anyo ng pagkamalikhain. Kinakatawan ng Gen-1 ang isa pa sa ating mahahalagang hakbang pasulong sa misyong ito. Kung ikaw ay isang malikhaing naghahanap upang mag-eksperimento sa hinaharap ng pagkukuwento, humiling ng access sa ibaba.

Magagamit din ang Gen-1 upang lumikha ng ganap na bagong mga video mula sa simula. Maaari itong gamitin para sa ilang layunin, kabilang ang paglikha ng mga bagong bersyon ng mga kasalukuyang pelikula o paglikha ng mga bagong pelikula sa kabuuan. Ang balitang ito ay tiyak na magpapasigla sa mga gumagawa ng pelikula at iba pang mga creative na laging naghahanap ng mga bagong paraan upang itulak ang mga hangganan ng kanilang sining. Sa Gen-1, mayroon na silang bagong makapangyarihang tool sa kanilang pagtatapon.

Ang kakayahan na bumuo ng mga bagong video mula sa mga umiiral na ay may bilang ng mga potensyal na aplikasyon. Halimbawa, maaari itong magamit upang lumikha ng mga bagong bersyon ng kasalukuyang nilalaman ng video, kaya maaari itong magamit para sa paglikha ng mga alternatibong bersyon ng mga eksena o mga kuha na maaaring masyadong mahal o logistik na mahirap i-film.

Maaari kang mag-apply para gamitin ang modelo habang nasa beta testing ito dito.

Magbasa pa tungkol sa AI:

Pagtanggi sa pananagutan

Sa linya na may Mga alituntunin ng Trust Project, pakitandaan na ang impormasyong ibinigay sa pahinang ito ay hindi nilayon at hindi dapat bigyang-kahulugan bilang legal, buwis, pamumuhunan, pananalapi, o anumang iba pang paraan ng payo. Mahalagang mamuhunan lamang kung ano ang maaari mong mawala at humingi ng independiyenteng payo sa pananalapi kung mayroon kang anumang mga pagdududa. Para sa karagdagang impormasyon, iminumungkahi naming sumangguni sa mga tuntunin at kundisyon pati na rin sa mga pahina ng tulong at suporta na ibinigay ng nagbigay o advertiser. MetaversePost ay nakatuon sa tumpak, walang pinapanigan na pag-uulat, ngunit ang mga kondisyon ng merkado ay maaaring magbago nang walang abiso.

Tungkol sa Ang May-akda

Si Damir ang pinuno ng pangkat, tagapamahala ng produkto, at editor sa Metaverse Post, sumasaklaw sa mga paksa gaya ng AI/ML, AGI, LLMs, Metaverse, at Web3-mga kaugnay na larangan. Ang kanyang mga artikulo ay umaakit ng napakalaking madla na mahigit sa isang milyong user bawat buwan. Mukhang isa siyang eksperto na may 10 taong karanasan sa SEO at digital marketing. Nabanggit si Damir sa Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, at iba pang publikasyon. Naglalakbay siya sa pagitan ng UAE, Turkey, Russia, at ng CIS bilang digital nomad. Nakamit ni Damir ang bachelor's degree sa physics, na pinaniniwalaan niyang nagbigay sa kanya ng mga kritikal na kasanayan sa pag-iisip na kailangan para maging matagumpay sa pabago-bagong tanawin ng internet. 

Mas marami pang artikulo
Damir Yalalov
Damir Yalalov

Si Damir ang pinuno ng pangkat, tagapamahala ng produkto, at editor sa Metaverse Post, sumasaklaw sa mga paksa gaya ng AI/ML, AGI, LLMs, Metaverse, at Web3-mga kaugnay na larangan. Ang kanyang mga artikulo ay umaakit ng napakalaking madla na mahigit sa isang milyong user bawat buwan. Mukhang isa siyang eksperto na may 10 taong karanasan sa SEO at digital marketing. Nabanggit si Damir sa Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, at iba pang publikasyon. Naglalakbay siya sa pagitan ng UAE, Turkey, Russia, at ng CIS bilang digital nomad. Nakamit ni Damir ang bachelor's degree sa physics, na pinaniniwalaan niyang nagbigay sa kanya ng mga kritikal na kasanayan sa pag-iisip na kailangan para maging matagumpay sa pabago-bagong tanawin ng internet. 

The DOGE Frenzy: Pagsusuri sa Kamakailang Pagtaas ng Halaga ng Dogecoin (DOGE).

Ang industriya ng cryptocurrency ay mabilis na lumalawak, at ang mga meme coins ay naghahanda para sa isang makabuluhang pagtaas. Dogecoin (DOGE), ...

Malaman Higit Pa

Ang Ebolusyon ng AI-Generated Content sa Metaverse

Ang paglitaw ng generative na nilalaman ng AI ay isa sa mga pinaka-kamangha-manghang pag-unlad sa loob ng virtual na kapaligiran ...

Malaman Higit Pa
Sumali sa Aming Innovative Tech Community
Magbasa Pa
Magbasa nang higit pa
Mga Nangungunang Deal ngayong Linggo, Mga Pangunahing Pamumuhunan sa AI, IT, Web3, at Crypto (22-26.04)
Digest Negosyo markets Teknolohiya
Mga Nangungunang Deal ngayong Linggo, Mga Pangunahing Pamumuhunan sa AI, IT, Web3, at Crypto (22-26.04)
Abril 26, 2024
Mga Komento ni Vitalik Buterin Tungkol sa Sentralisasyon Ng PoW, Mga Tala na Ito ay Pansamantalang Yugto Hanggang sa PoS
Ulat sa Balita Teknolohiya
Mga Komento ni Vitalik Buterin Tungkol sa Sentralisasyon Ng PoW, Mga Tala na Ito ay Pansamantalang Yugto Hanggang sa PoS
Abril 26, 2024
Inihayag ng Offchain Labs ang Pagtuklas ng Dalawang Kritikal na Kahinaan Sa Mga Patunay ng Panloloko ng OP Stack ng Optimism
Ulat sa Balita software Teknolohiya
Inihayag ng Offchain Labs ang Pagtuklas ng Dalawang Kritikal na Kahinaan Sa Mga Patunay ng Panloloko ng OP Stack ng Optimism
Abril 26, 2024
Ang Open Market ng Dymension Para sa Bridging Liquidity Mula sa RollApps eIBC Inilunsad Sa Mainnet
Ulat sa Balita Teknolohiya
Ang Open Market ng Dymension Para sa Bridging Liquidity Mula sa RollApps eIBC Inilunsad Sa Mainnet 
Abril 26, 2024
CRYPTOMERIA LABS PTE. LTD.