AI Wiki Māksla izglītība programmatūra Tehnoloģija
Aprīlis 24, 2024

Soras uzplaukums: kā AI ir Redefivideo satura izveides ainavu

Īsumā

Sora ir progresīvs teksta-video AI modelis, kas sola pilnībā mainīt video veidošanas spēli.

Adobe nesen atklāja plānus integrēt ģeneratīvos AI rīkus Premiere Pro programmatūra. Šī kustība, kas ietver lietotājiem piekļuves piešķiršanu tādiem rīkiem kā OpenAI's Sora tieši Premiere Pro ir paredzēts, lai bagātinātu programmatūru ar AI darbināmām iespējām, piemēram, sižetu manipulācijām un uzmanības novēršanas novēršanu.

Kaut gan OpenAISora pašlaik nav pieejama sabiedrībai, Adobe demonstrēja savu integrāciju Premiere Pro kā eksperimentālu līdzekli, nenorādot konkrētu tā izlaišanas laika grafiku.

Sora ir progresīvs teksta-video AI modelis, kas pievērsa uzmanību, jo solīja pilnībā mainīt video veidošanas spēli. Šī tehnoloģija ir daudzsološs ārkārtēju efektu rīks ikvienam, kam ir kāds sakars ar video producēšanu, kustību dizainu un animāciju, un šī tehnoloģija arī rada būtiskas problēmas.

Izpētīsim visas neticamās un ļoti gaidītās Soras šķautnes.

Teksts uz video?

Būtībā Sora ir izstrādāta, lai izveidotu reālistiskus un vizuāli aizraujošus videoklipus, kas ģenerēti no teksta uzvednēm. Kā novatorisks mākslīgā intelekta lietojums, Sora mērķis ir racionalizēt video veidošanas procesu un piedāvāt jaunas iespējas stāstījuma procesiem un vizuālajai komunikācijai.

Sora funkcionalitāte sakņojas tās spējā interpretēt un izpildīt teksta komandas, lai izveidotu pārliecinošu video saturu. Izmantojot uzlabotas dziļās mācīšanās metodes un valodas izpratni, Sora apstrādā ievades tekstu un konstruē atbilstošas ​​vizuālas ainas ar rakstzīmēm, iestatījumiem un kustību. Šis process ietver sarežģītu mijiedarbību starp dabiskās valodas apstrādi un video sintēzi, radot izvadi, kas ir cieši saskaņota ar sniegtajām teksta uzvednēm.

Attīstot Sora, OpenAIKomanda uzsvēra, cik svarīgi ir izveidot AI modeli, kas aptver dziļu valodas izpratni un stingru vizuālo stāstu principu izpratni. Integrējot jaunākos sasniegumus dabiskās valodas izpratnē un video sintēzē, Sora dizains par prioritāti izvirza lingvistiskās izteiksmes un vizuālās reprezentācijas vienotu saplūšanu.

Kā tas vispār ir iespējams?

Tātad Sora darbojas kā difūzijas modelis, kas ir līdzīgs citiem ģeneratīvajiem AI, kas darbojas ar teksta pārveidošanu attēlā. Tas nozīmē, ka Sora katru kadru sāk ar statisku troksni, pēc tam pārveido attēlus attēlos, kas līdzinās dotajai uzvednei un gaidāmā aprakstam. Tas ir iespējams, pateicoties mašīnmācībai. Sora video var ilgt līdz 60 sekundēm.

Pievēršoties laika konsekvencei, Sora ievieš jauninājumus, vienlaikus apsverot vairākus video kadrus, nodrošinot saskaņotību, objektiem pārvietojoties ainā.

Iekļaujot gan difūzijas, gan transformatoru modeļus, Sora izmanto līdzīgu hibrīda pieeju GPTtransformatora arhitektūra. Džeks Cjao izceļ šo modeļu papildu stiprās puses, jo difūzija ir izcila tekstūras veidošanā, bet tai trūkst globālā sastāva, savukārt transformatori izceļas ar augsta līmeņa izkārtojuma noteikšanu. Kombinācija izmanto transformatora spēju organizēt ielāpus, kamēr difūzijas modelis aizpilda detaļas.

Sora ieviešanā attēli tiek sadalīti trīsdimensiju ielāpus, lai pielāgotos laika noturībai. Tas atspoguļo tokenizācijas procesu valodu modeļos, kur ielāpi attēlo attēlu kopas elementus. Turklāt, lai racionalizētu skaitļošanas efektivitāti, tiek piemērots dimensiju samazināšanas solis.

Lai uzlabotu video precizitāti, Sora izmanto atkārtošanas paņēmienu, kas ir līdzīgs DALL E 3, Kur GPT pirms video ģenerēšanas pārraksta lietotāja uzvednes ar papildu informāciju. Tas kalpo kā automātiskas tūlītējas precizēšanas veids, nodrošinot uzticamu lietotāja ievades ievērošanu.

Cik laba tagad ir Sora?

OpenAI atzīst vairākus ierobežojumus pašreizējā Sora iterācijā. Jo īpaši Sorai trūkst fizikas izpratnes, kas nozīmē, ka tā var konsekventi neievērot reālās pasaules fiziskos principus.

Piemēram, modelis nespēj aptvert cēloņu un seku attiecības, kā rezultātā rodas iespējamas neatbilstības. Tāpat objektu telpiskā pozicionēšana var parādīt nedabiskas nobīdes.

Runājot par uzticamību, Sora statuss joprojām ir neskaidrs. Lai gan OpenAI ir prezentējis piemērus, kas demonstrē augstu kvalitāti, nav skaidrs, cik lielā mērā ir notikusi selektīva demonstrēšana. Lietojumprogrammās teksta pārvēršanai attēlā vairāku attēlu ģenerēšana un labākā izvēle ir ierasta prakse. Precīzs attēlu skaits, ko ražojis OpenAI komanda, kas demonstrēs videoklipus savā paziņojuma rakstā, netiek izpausta. Šis pārskatāmības trūkums varētu kavēt pieņemšanu, īpaši, ja ir jāģenerē simtiem vai tūkstošiem videoklipu, lai iegūtu tikai vienu izmantojamu rezultātu. Lai mazinātu šo nenoteiktību, mums jāgaida plašāka rīka pieejamība.

Kur Sora noderēs?

Sora iespējas attiecas uz video izveidi no jauna, esošā materiāla pagarināšanu un nemanāmu trūkstošo kadru aizpildīšanu videoklipos.

Līdzīgi kā teksta pārveides AI rīki radīja revolūciju attēlu veidošanā bez tehniskām rediģēšanas prasmēm, Sora mērķis ir vienkāršot video veidošanu, neprasot attēlu rediģēšanas zināšanas. Šeit ir daži primārie lietojumprogrammu scenāriji:

  • Sora ļauj izveidot īsas formas videoklipus, kas pielāgoti sociālo mediju platformām, piemēram, TikTok, Instagram Reels un YouTube Shorts. Tas īpaši izceļas, veidojot saturu, kuru var būt grūti vai nepraktiski filmēt, izmantojot tradicionālās metodes.
  • Tradicionāli dārgus pasākumus, piemēram, reklāmu, reklāmas video un produktu demonstrāciju veidošanu, var ievērojami vienkāršot, izmantojot teksta pārveides AI rīkus, piemēram, Sora, kas piedāvā rentablus risinājumus.
  • Pat ja AI ģenerētie videoklipi netiek integrēti galaproduktos, tie kalpo kā vērtīgi rīki koncepciju ātrai ilustrēšanai. Filmu veidotāji var izmantot AI sižetu maketiem pirms uzņemšanas, savukārt dizaineri var vizualizēt produktus pirms izgatavošanas. Piemēram, rotaļlietu uzņēmums varētu izmantot Sora, lai izveidotu jaunas pirātu kuģa rotaļlietas mākslīgā intelekta maketu, lai pirms masveida ražošanas novērtētu tās iespējamību.
  • Sintētiskie dati izrādās nenovērtējami situācijās, kad privātuma vai iespējamības apsvērumi neļauj izmantot reālus datus. Lai gan parasti tos izmanto skaitliskiem datiem, piemēram, finanšu ierakstiem un personu identificējošai informācijai, plašākai pieejamībai var ģenerēt sintētiskos datus ar līdzīgām īpašībām. Video jomā sintētiskie dati ir noderīgi datorredzes sistēmu apmācībai.

Ar Soru saistītie izaicinājumi

  • Kā jaunizveidots produkts, Sora riski vēl nav pilnībā noskaidroti; tomēr paredzams, ka tie būs līdzīgi tiem, kas sastopami ar teksta pārveides modeļiem.
  • Bez pietiekamiem aizsardzības pasākumiem Sora var radīt nevēlamu vai nepiemērotu saturu, piemēram, videoklipus, kuros ir vardarbība, grafiski attēli, seksuāla rakstura materiāli, noteiktu grupu nievājoši attēlojumi un nelikumīgu darbību veicināšana vai slavināšana. Tas, kas ir uzskatāms par nepiemērotu saturu, var ievērojami atšķirties atkarībā no lietotāja (piemēram, bērns vai pieaugušais) un apstākļiem, kādos videoklipi tiek ģenerēti (piemēram, izglītojošs video par uguņošanas briesmām, kurā netīši tiek rādītas grafiskas ainas).
  • Video piemēri, kurus kopīgoja OpenAI parādīt, ka viena no Soras ievērojamajām spējām ir tās prasme radīt tēlainus scenārijus, kas pārsniedz realitāti. Tomēr šī iespēja padara to neaizsargātu pret “dziļa viltība” videoklipi, kuros tiek mainītas patiesas personas vai situācijas, lai nodotu nepatiesus faktus gan netīši (dezinformācija), gan apzināti (dezinformācija). Šāds saturs var radīt nopietnas sekas.
  • Ģeneratīvo AI modeļu iegūtie rezultāti pēc būtības ir saistīti ar datiem, par kuriem tie tika apmācīti. Tāpēc ģenerētajos videoklipos var parādīties kultūras aizspriedumi vai stereotipi, kas iegulti apmācības datos, iespējams, saglabājot līdzīgas problēmas.

Ko dara OpenAI Vai komanda dara, lai novērstu iepriekš minētos riskus?

Pašlaik Sora ir pieejama tikai “sarkanā komanda” pētnieki — eksperti, kuru uzdevums ir identificēt un mazināt iespējamās problēmas ar modeli. Šie pētnieki cenšas ģenerēt saturu, kurā var būt norādīti riski, kas ļauj OpenAI risināt un novērst visas bažas pirms Sora publiskas atbrīvošanas.

Vai Sora var atstāt mani bez darba?

Sora spēja radīt augstākā līmeņa video saturu, pamatojoties uz teksta norādēm, var rosināt ievērojamas pārmaiņas radošās nodarbinātības vidē. Parastās pozīcijas videogrāfijā, specefektos un animācijās var novecot, saskaroties ar šādiem sasniegumiem. Lai gan daži reklāmas materiāli var mainīties, pilnveidojot zināšanas par AI funkciju pārraudzību, ētisku AI izmantošanu un radošu virzienu, lai izmantotu AI iespējas, šīs pārejas iespējamība visiem joprojām ir neskaidra.

No otras puses, samazinot tehniskos un finansiālos šķēršļus, kas saistīti ar video veidošanu, Sora var dot iespēju plašākam personu lokam izveidot augstas kvalitātes saturu. Šī demokratizācija var veicināt daudzveidīga un izgudrojuma satura izplatīšanas pieaugumu. Lai gan tas var radīt nepieciešamību izveidotajām mediju struktūrām un satura veidotājiem pielāgot un ieviest novatoriskas pieejas, šī attīstība varētu vēstīt par pozitīvu rezultātu.

Jebkurā gadījumā pēc masveida izlaišanas Sora neapšaubāmi izraisīs izmaiņas video un ar to saistītajās nozarēs, kā arī personīgā satura veidošanā.

Ilgtermiņa sekas OpenAI Sora

Kad Sora iesakņojas profesionālajās darbplūsmās, tās ilgstošā ietekme atklājas:

Augstas vērtības lietošanas gadījumu atbloķēšana: Sora integrācija dažādās nozarēs sola transformējošas lietojumprogrammas, tostarp:

  • Paātrināta satura ražošana: Sora racionalizē multivides izveidi VR, AR, spēļu un tradicionālās izklaides nozarēs, paātrinot ražošanas ciklus un atvieglojot ideju radīšanu.
  • Personalizēta pieredze: parādās pielāgots saturs, ko Sora kurējis, lai tas atbilstu individuālajām vēlmēm, pārveidojot izklaides un izglītības paradigmas, lai tās atbilstu dažādiem mācīšanās stiliem un gaumēm.
  • Pielāgošana reāllaikā: dinamiskā video rediģēšana, ko iespējojusi Sora, ļauj veikt satura izmaiņas lidojumā, apmierinot auditorijas vēlmes un atsauksmes reāllaikā.
  • Digitālo robežu izplūšana: Sora sinerģija ar VR un AR izjauc robežas starp fizisko un digitālo jomu, piedāvājot jaunu, aizraujošu pieredzi un interaktīvas stāstu iespējas.

Būtībā Sora parādīšanās vēsta par pārveidojošu laikmetu AI vadītā satura veidošanā, dziļi pārveidojot nozares, stāstījumus un lietotāju pieredzi.

Atbildības noraidīšana

Atbilstīgi Uzticības projekta vadlīnijas, lūdzu, ņemiet vērā, ka šajā lapā sniegtā informācija nav paredzēta un to nedrīkst interpretēt kā juridisku, nodokļu, ieguldījumu, finanšu vai jebkāda cita veida padomu. Ir svarīgi ieguldīt tikai to, ko varat atļauties zaudēt, un meklēt neatkarīgu finanšu padomu, ja jums ir šaubas. Lai iegūtu papildinformāciju, iesakām skatīt pakalpojumu sniegšanas noteikumus, kā arī palīdzības un atbalsta lapas, ko nodrošina izdevējs vai reklāmdevējs. MetaversePost ir apņēmies sniegt precīzus, objektīvus pārskatus, taču tirgus apstākļi var tikt mainīti bez iepriekšēja brīdinājuma.

Par Autors

Žauhazins ir tekstu autors un galvenais socioloģijas speciālists. Aizraujoties ar zinātnes un tehnoloģiju studiju sarežģīto dinamiku, viņa dziļi iedziļinās Web3 ar dedzīgu aizraušanos ar blokķēdi.

Vairāk rakstus
Žauhazins Šadens
Žauhazins Šadens

Žauhazins ir tekstu autors un galvenais socioloģijas speciālists. Aizraujoties ar zinātnes un tehnoloģiju studiju sarežģīto dinamiku, viņa dziļi iedziļinās Web3 ar dedzīgu aizraušanos ar blokķēdi.

Hot Stories
Pievienojieties mūsu informatīvajam izdevumam.
Jaunākās ziņas

Nepastāvības apstākļos institucionālā apetīte pieaug pret Bitcoin ETF

Informācijas atklāšana, izmantojot 13F pieteikumus, atklāj ievērojamus institucionālos investorus, kas iesaistās Bitcoin ETF, uzsverot pieaugošo pieņemšanu ...

Uzziniet vairāk

Pienāk notiesāšanas diena: CZ liktenis ir līdzsvarā, jo ASV tiesa izskata DOJ lūgumu

Šodien ASV tiesā Sietlā Čanpens Džao ir gatavs notiesāt.

Uzziniet vairāk
Pievienojieties mūsu novatoriskajai tehnoloģiju kopienai
Lasīt vairāk
Vairāk
Donalda Trampa pāreja uz kriptovalūtu: no pretinieka par aizstāvi un ko tas nozīmē ASV kriptovalūtu tirgum
bizness Markets Stāsti un atsauksmes Tehnoloģija
Donalda Trampa pāreja uz kriptovalūtu: no pretinieka par aizstāvi un ko tas nozīmē ASV kriptovalūtu tirgum
10. gada 2024. maijs
Layer3, lai šovasar laistu klajā L3 marķieri, piešķirot 51% no kopējā piedāvājuma kopienai
Markets Ziņojums Tehnoloģija
Layer3, lai šovasar laistu klajā L3 marķieri, piešķirot 51% no kopējā piedāvājuma kopienai
10. gada 2024. maijs
Edvarda Snoudena pēdējais brīdinājums Bitcoin izstrādātājiem: “Padariet privātumu par protokola līmeņa prioritāti vai riskējiet to zaudēt
Markets Drošība Wiki programmatūra Stāsti un atsauksmes Tehnoloģija
Edvarda Snoudena pēdējais brīdinājums Bitcoin izstrādātājiem: “Padariet privātumu par protokola līmeņa prioritāti vai riskējiet to zaudēt
10. gada 2024. maijs
Ar optimismu darbināms Ethereum Layer 2 Network Mint, lai palaistu savu galveno tīklu 15. maijā
Ziņojums Tehnoloģija
Ar optimismu darbināms Ethereum Layer 2 Network Mint, lai palaistu savu galveno tīklu 15. maijā
10. gada 2024. maijs
CRYPTOMERIA LABS PTE. LTD.