Gen-1: Bumuo ang AI ng Mga Bagong Video Mula sa Mga Umiiral sa pamamagitan ng Pagsasama-sama ng Mga Prompt at Mga Larawan
Sa madaling sabi
Ang Gen-1 ay isang neural network na maaaring makabuo ng mga bagong video mula sa mga dati nang video sa pamamagitan ng pagsasama-sama mga senyas at mga larawan.
Maaari rin itong magamit upang lumikha ng ganap na bagong mga video mula sa simula.
Ang kakayahang makabuo ng mga bagong video mula sa mga umiiral na ay may bilang ng mga potensyal na application.
RunWayML, isang artificial intelligence startup, ay inihayag isang bagong produkto na tinatawag na Gen-1, isang neural network na maaaring makabuo ng mga bagong video mula sa mga umiiral na sa pamamagitan ng pagsasama-sama ng mga prompt at larawan. Sa loob ng maraming taon, ang mga neural network ay limitado sa gawain ng paglipat ng istilo, na kung saan ay ang proseso ng pagkuha ng isang imahe at paglalapat ng estilo ng isa pang imahe dito. Ito ay kung paano namin nakukuha ang mga trippy na deep-learning na mga video na paglilipat ng istilo kung saan, halimbawa, isang landscape ay na-render sa istilo ng Starry Night ni Van Gogh.
Ngayon, sa Gen-1, higit pa sa paglipat ng istilo ang magagawa ng mga neural network. Maaari itong bumuo ng mga bagong video mula sa simula, gamit ang mga senyas at larawan bilang input. Nagbubukas ito ng isang buong bagong hanay ng mga posibilidad para sa Mga video na nilikha ng AI. Sa ngayon, ang mga video na nabuo ng Gen-1 ay maikli at simple. Ngunit habang umuunlad ang teknolohiya, maaari nating asahan na makakita ng mas kumplikado at makatotohanang mga video na binuo ng AI.
Inirerekomendang post: Ang kalusugan ng reproduktibo ng mga lalaki ay napabuti sa pamamagitan ng panonood ng mga pang-adultong video sa virtual reality |
Ano ang Gen-1?
Ang malakas na mga tool sa paggawa at pag-edit ng larawan ay na-unlock ng text-guided mga modelo ng generative diffusion. Habang ang mga ito ay inilapat sa paglikha ng mga video, ang kasalukuyang mga pamamaraan para sa pag-edit ng nilalaman ng umiiral nang materyal habang pinapanatili ang istraktura nito ay nangangailangan ng mamahaling muling pagsasanay para sa bawat input o nakadepende sa peligrosong pagpapalaganap ng mga pagbabago sa larawan sa pagitan ng mga frame.
Ang mga developer ay naglalarawan ng isang modelo para sa structure- at content-guided video diffusion, na nagbabago ng mga pelikula batay sa alinman sa nakasulat o visual na paglalarawan ng nais na resulta. Dahil sa hindi sapat na pag-decoupling, lumilitaw ang mga salungatan sa pagitan ng mga pagbabago sa content na ibinigay ng user at mga representasyon ng istruktura. Ipinakikita nila na ang istruktura at integridad ng nilalaman ay maaaring kontrolin ng pagsasanay sa mga monocular depth na pagtatantya na may iba't ibang antas ng detalye.
Mag-synthesize ng mga bagong video sa isang makatotohanan at pare-parehong paraan sa pamamagitan ng paglalapat ng komposisyon at istilo ng isang larawan o text prompt sa istruktura ng iyong pinagmulang video. Ito ay tulad ng paggawa ng pelikula ng isang bagay na bago nang hindi aktwal na kinukunan ng anuman.
Ang paglilipat ng istilo ng isang imahe o prompt sa bawat frame ng isang video ay maaaring maging isang mahusay na paraan upang pag-isahin ang iyong proyekto, bigyan ito ng isang pangkalahatang visual na tema, at lumikha ng pagkakapare-pareho.
Sa pamamagitan ng paggamit ng software at malikhaing disenyo, ang mga mockup ay maaaring gawing aesthetically pleasing at interactive na mga render na nagbibigay-buhay sa paningin ng user.
Sa mga feature sa pag-edit ng video, madaling ihiwalay ang mga bahagi ng isang video at pagandahin ang mga ito gamit ang mga text prompt.
Paglalapat ng input na imahe o prompt sa mga untextured na render ay maaaring lubos na mapahusay ang kanilang pagiging totoo, na nagbibigay-buhay sa mga 3D na modelo.
Ang Runway Research ay nakatuon sa pagbuo ng multimodal AI system na nagbibigay-daan sa mga bagong anyo ng pagkamalikhain. Kinakatawan ng Gen-1 ang isa pa sa ating mahahalagang hakbang pasulong sa misyong ito. Kung ikaw ay isang malikhaing naghahanap upang mag-eksperimento sa hinaharap ng pagkukuwento, humiling ng access sa ibaba.
Magagamit din ang Gen-1 upang lumikha ng ganap na bagong mga video mula sa simula. Maaari itong gamitin para sa ilang layunin, kabilang ang paglikha ng mga bagong bersyon ng mga kasalukuyang pelikula o paglikha ng mga bagong pelikula sa kabuuan. Ang balitang ito ay tiyak na magpapasigla sa mga gumagawa ng pelikula at iba pang mga creative na laging naghahanap ng mga bagong paraan upang itulak ang mga hangganan ng kanilang sining. Sa Gen-1, mayroon na silang bagong makapangyarihang tool sa kanilang pagtatapon.
Ang kakayahan na bumuo ng mga bagong video mula sa mga umiiral na ay may bilang ng mga potensyal na aplikasyon. Halimbawa, maaari itong magamit upang lumikha ng mga bagong bersyon ng kasalukuyang nilalaman ng video, kaya maaari itong magamit para sa paglikha ng mga alternatibong bersyon ng mga eksena o mga kuha na maaaring masyadong mahal o logistik na mahirap i-film.
Maaari kang mag-apply para gamitin ang modelo habang nasa beta testing ito dito.
Magbasa pa tungkol sa AI:
Pagtanggi sa pananagutan
Sa linya na may Mga alituntunin ng Trust Project, pakitandaan na ang impormasyong ibinigay sa pahinang ito ay hindi nilayon at hindi dapat bigyang-kahulugan bilang legal, buwis, pamumuhunan, pananalapi, o anumang iba pang paraan ng payo. Mahalagang mamuhunan lamang kung ano ang maaari mong mawala at humingi ng independiyenteng payo sa pananalapi kung mayroon kang anumang mga pagdududa. Para sa karagdagang impormasyon, iminumungkahi naming sumangguni sa mga tuntunin at kundisyon pati na rin sa mga pahina ng tulong at suporta na ibinigay ng nagbigay o advertiser. MetaversePost ay nakatuon sa tumpak, walang pinapanigan na pag-uulat, ngunit ang mga kondisyon ng merkado ay maaaring magbago nang walang abiso.
Tungkol sa Ang May-akda
Si Damir ang pinuno ng pangkat, tagapamahala ng produkto, at editor sa Metaverse Post, sumasaklaw sa mga paksa gaya ng AI/ML, AGI, LLMs, Metaverse, at Web3-mga kaugnay na larangan. Ang kanyang mga artikulo ay umaakit ng napakalaking madla na mahigit sa isang milyong user bawat buwan. Mukhang isa siyang eksperto na may 10 taong karanasan sa SEO at digital marketing. Nabanggit si Damir sa Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, at iba pang publikasyon. Naglalakbay siya sa pagitan ng UAE, Turkey, Russia, at ng CIS bilang digital nomad. Nakamit ni Damir ang bachelor's degree sa physics, na pinaniniwalaan niyang nagbigay sa kanya ng mga kritikal na kasanayan sa pag-iisip na kailangan para maging matagumpay sa pabago-bagong tanawin ng internet.
Mas marami pang artikuloSi Damir ang pinuno ng pangkat, tagapamahala ng produkto, at editor sa Metaverse Post, sumasaklaw sa mga paksa gaya ng AI/ML, AGI, LLMs, Metaverse, at Web3-mga kaugnay na larangan. Ang kanyang mga artikulo ay umaakit ng napakalaking madla na mahigit sa isang milyong user bawat buwan. Mukhang isa siyang eksperto na may 10 taong karanasan sa SEO at digital marketing. Nabanggit si Damir sa Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, at iba pang publikasyon. Naglalakbay siya sa pagitan ng UAE, Turkey, Russia, at ng CIS bilang digital nomad. Nakamit ni Damir ang bachelor's degree sa physics, na pinaniniwalaan niyang nagbigay sa kanya ng mga kritikal na kasanayan sa pag-iisip na kailangan para maging matagumpay sa pabago-bagong tanawin ng internet.