AI Wiki Kunst Käsitöö tarkvara Tehnoloogia
Aprill 24, 2024

Sora tõus: kuidas AI on Redefining videosisu loomise maastik

Põgusalt

Sora on progressiivne tekst-videoks tehisintellekti mudel, mis lubab video loomise mängu täielikult muuta.

Adobe avalikustas hiljuti plaanid integreerida generatiivsed AI tööriistad Premiere Pro tarkvara. See samm, mis hõlmab kasutajatele juurdepääsu andmist sellistele tööriistadele nagu OpenAIOtse Premiere Pro sees oleva Sora eesmärk on rikastada tarkvara tehisintellektil põhinevate võimalustega, nagu stseeni manipuleerimine ja tähelepanu kõrvalejuhtimise eemaldamine.

Kuigi OpenAI's Sora ei ole praegu avalikkusele juurdepääsetav, Adobe demonstreeris selle integreerimist Premiere Pro-sse eksperimentaalse funktsioonina, andmata selle väljalaskmiseks konkreetset ajakava.

Sora on progressiivne tekst videoks tehisintellekti mudel, mis pälvis tähelepanu tänu lubadusele muuta videoloome mängu täielikult. See tehnoloogia on paljutõotav äärmusliku efektiga tööriist kõigile, kellel on midagi pistmist videote tootmise, liikumisdisaini ja animatsiooniga. Sellel tehnoloogial on ka olulisi väljakutseid.

Uurime uskumatu ja kauaoodatud Sora kõiki tahke.

Tekst videoks?

Põhimõtteliselt on Sora loodud tekstiviipade põhjal loodud elutruu ja visuaalselt kütkestavate videote tegemiseks. Tehisintellekti uuendusliku rakendusena on Sora eesmärgiks videotootmisprotsessi sujuvamaks muutmine ning uute võimaluste pakkumine narratiivseteks protsessideks ja visuaalseks suhtluseks.

Sora funktsionaalsuse juured on selle võimes tõlgendada ja täita tekstilisi käske, et luua mõjuvat videosisu. Kasutades täiustatud süvaõppe tehnikaid ja keele mõistmist, töötleb Sora sisendteksti ja konstrueerib vastavaid visuaalseid stseene tegelaste, seadete ja liikumisega. See protsess hõlmab keerukat koosmõju loomuliku keele töötlemise ja video sünteesi vahel, andes väljundi, mis ühtib täpselt pakutavate tekstiviipadega.

Sora arendamisel OpenAIMeeskond rõhutas, kui oluline on luua tehisintellekti mudel, mis hõlmab sügavat keele mõistmist ja visuaalse jutuvestmise põhimõtete tugevat mõistmist. Integreerides loomuliku keele mõistmise ja videosünteesi tipptasemel edusammud, seab Sora disain esikohale keelelise väljenduse ja visuaalse esituse ühtse sulandumise.

Kuidas see üldse võimalik on?

Seega toimib Sora difusioonimudelina, mis sarnaneb teiste generatiivsete AI-dega, mis töötavad tekstist pildiks. See tähendab, et Sora alustab iga kaadrit staatilise müraga, seejärel teisendab pildid kujutisteks, mis meenutavad antud viipa ja ootuste kirjeldust. See on võimalik tänu masinõppele. Sora videod võivad kesta kuni 60 sekundit.

Ajalise järjepidevuse tagamiseks teeb Sora uuendusi, kaaludes korraga mitut videokaadrit, tagades objektide stseenis liikumisel sidususe.

Sisaldab nii difusiooni- kui ka trafomudeleid, järgib Sora hübriidset lähenemisviisi, mis on sarnane GPTtrafo arhitektuur. Jack Qiao tõstab esile nende mudelite üksteist täiendavad tugevused, kuna difusioon on suurepärane tekstuuri genereerimisel, kuid puudub ülemaailmne koostis, samas kui trafod paistavad silma kõrgetasemelise paigutuse määramisel. Kombinatsioon võimendab trafo võimet korraldada plaastreid, samal ajal kui difusioonimudel täidab üksikasjad.

Sora teostuses on pildid jaotatud kolmemõõtmelisteks laigudeks, et kohandada ajalist püsivust. See peegeldab tokeniseerimisprotsessi keelemudelites, kus plaastrid esindavad kujutiste komplekti elemente. Lisaks rakendatakse arvutusliku tõhususe tõhustamiseks mõõtmete vähendamise etappi.

Video täpsuse suurendamiseks kasutab Sora sarnast ümberkirjutustehnikat DALL E 3, Kus GPT kirjutab enne video loomist kasutajaviibad ümber täiendavate üksikasjadega. See toimib automaatse viipe täpsustamise vormina, tagades kasutaja sisendi truu järgimise.

Kui hea Sora praegu on?

OpenAI tunnistab mitmeid piiranguid praeguses Sora iteratsioonis. Nimelt puudub Soral omane arusaam füüsikast, mis tähendab, et ta ei pruugi järjekindlalt järgida reaalse maailma füüsikalisi põhimõtteid.

Näiteks ei suuda mudel mõista põhjus-tagajärg seoseid, mille tulemuseks on võimalikud vastuolud. Samuti võib objektide ruumiline paigutus näidata ebaloomulikke nihkeid.

Usaldusväärsuse osas on Sora staatus endiselt ebakindel. Kuigi OpenAI on esitanud näiteid, mis näitavad kõrget kvaliteeti, on ebaselge, mil määral on selektiivset esitlemist toimunud. Tekstist pildiks muutvates rakendustes on mitme pildi genereerimine ja parima valimine tavaline. Täpne piltide arv, mille on teinud OpenAI meeskond, kes tutvustab oma kuulutusartiklis videoid, on avalikustamata. Läbipaistvuse puudumine võib potentsiaalselt takistada kasutuselevõttu, eriti kui vaid ühe kasutatava tulemuse saamiseks on vaja luua sadu või tuhandeid videoid. Selle ebakindluse leevendamiseks peame ootama tööriista laiemat kättesaadavust.

Kus saab Sora kasutust saada?

Sora võimalused laienevad video loomisele nullist, olemasoleva materjali pikendamisele ja puuduvate kaadrite sujuvale täitmisele videotes.

Sarnaselt sellele, kuidas tekstist pildiks generatiivsed AI-tööriistad muutsid piltide loomise ilma tehniliste redigeerimisoskusteta, on Sora eesmärk lihtsustada videote tootmist, ilma et oleks vaja pilditöötlusteadmisi. Siin on mõned peamised rakenduse stsenaariumid.

  • Sora võimaldab luua lühivideoid, mis on kohandatud sotsiaalmeedia platvormidele, nagu TikTok, Instagram Reels ja YouTube Shorts. Eriti paistab see silma sellise sisu loomisel, mille filmimine traditsiooniliste meetoditega võib olla keeruline või ebapraktiline.
  • Traditsiooniliselt saab kuluefektiivseid lahendusi pakkuvate tekstist videoks tehisintellekti tööriistadega, nagu Sora, oluliselt lihtsustada kulukaid ettevõtmisi, nagu reklaamide, reklaamvideote ja tooteesitluste tegemine.
  • Isegi kui AI-ga loodud videoid lõpptoodetesse ei integreerita, on need väärtuslikud tööriistad kontseptsioonide kiireks illustreerimiseks. Filmitegijad saavad enne filmimist stseeni makettide jaoks kasutada tehisintellekti, samas kui disainerid saavad tooteid enne valmistamist visualiseerida. Näiteks võib mänguasjafirma kasutada Sora uue piraatlaeva mänguasja tehisintellekti maketi loomiseks, et hinnata selle teostatavust enne masstootmist.
  • Sünteetilised andmed on hindamatu väärtusega olukordades, kus privaatsus- või teostatavusprobleemid takistavad tegelike andmete kasutamist. Kuigi tavaliselt kasutatakse arvuliste andmete puhul, nagu finantsdokumendid ja isikut tuvastav teave, saab laiema juurdepääsetavuse huvides luua sarnaste omadustega sünteetilisi andmeid. Video valdkonnas on sünteetilised andmed kasulikud arvutinägemissüsteemide treenimiseks.

Soraga seotud väljakutsed

  • Uue tootena ei ole Sora riskid veel täielikult välja selgitatud; Siiski eeldatakse, et need on sarnased teksti-pildiks mudelite puhul esinevatega.
  • Ilma piisavate kaitsemeetmeteta võib Sora luua taunitavat või sobimatut sisu, nagu vägivalda sisaldavad videod, graafilised kujutised, seksuaalselt vulgaarne materjal, teatud rühmade halvustavad kujutised ja ebaseaduslike tegevuste propageerimine või ülistamine. Sobimatu sisu võib suuresti erineda olenevalt kasutajast (nt laps ja täiskasvanu) ja videote loomise asjaoludest (nt ilutulestikuohtude õpetlik video, mis näitab tahtmatult graafilisi stseene).
  • Näidisvideod, mida jagas OpenAI näidata, et Sora üks tähelepanuväärseid võimeid on oskus luua kujutlusvõimelisi stsenaariume, mis ulatuvad reaalsusest kaugemale. Sellegipoolest muudab see võimalus haavatavaks ka "sügav võlts” videod, kus ehtsaid isikuid või olukordi muudetakse, et edastada valet, kas tahtmatult (desinformatsioon) või tahtlikult (desinformatsioon). Selline sisu võib kaasa tuua olulisi tagajärgi.
  • Generatiivsete tehisintellekti mudelite saadud tulemused on oma olemuselt seotud andmetega, mille põhjal neid koolitati. Seetõttu võivad loodud videotes ilmneda koolitusandmetesse lisatud kultuurilised eelarvamused või stereotüübid, mis võivad sarnaseid probleeme säilitada.

Mida teeb OpenAI Kas meeskond teeb ülalmainitud ohtude ärahoidmiseks?

Praegu on Sora eranditult juurdepääsetavpunane meeskond” teadlased – eksperdid, kelle ülesanne on tuvastada ja leevendada mudeliga seotud võimalikke probleeme. Need teadlased püüavad luua sisu, mis võib sisaldada kirjeldatud riske, võimaldades OpenAI enne Sora avalikku vabastamist probleemide lahendamiseks ja kõrvaldamiseks.

Kas Sora võib mind ilma jätta?

Sora võime toota tekstilistel vihjetel põhinevat tipptasemel videosisu võib esile kutsuda märkimisväärseid muutusi loomingulises töökeskkonnas. Tavapärased positsioonid videograafias, eriefektides ja animatsioonis võivad selliste edusammude taustal vananeda. Kuigi mõned reklaamid võivad muutuda, täiustades teadmisi tehisintellekti funktsioonide, eetilise AI kasutamise ja loomingulise suuna juhtimisel tehisintellekti võimaluste kasutamiseks, on selle ülemineku teostatavus kõigi jaoks ebakindel.

Teisest küljest, vähendades videotootmisega seotud tehnilisi ja rahalisi takistusi, on Soral potentsiaali anda laiemale hulgale üksikisikuid kvaliteetse sisu meisterdamiseks. See demokratiseerumine võib soodustada mitmekesise ja leidliku sisu levitamise tõusu. Kuigi väljakujunenud meediaüksustel ja sisuloojatel võib tekkida vajadus uuenduslike lähenemisviiside kohandamiseks ja kasutuselevõtuks, võib see areng kuulutada positiivseid tulemusi.

Mõlemal juhul põhjustab Sora pärast massväljaannet kahtlemata muutusi video- ja sellega seotud tööstusharudes, aga ka isikliku sisu loomises.

Pikaajalised tagajärjed OpenAI Sora

Kui Sora juurdub professionaalsetesse töövoogudesse, avaldub selle püsiv mõju:

Väärtuslike kasutusjuhtumite avamine: Sora integratsioon tööstusharude vahel lubab transformatiivseid rakendusi, sealhulgas:

  • Kiirendatud sisutootmine: Sora lihtsustab meedia loomist VR-i, AR-i, mängude ja traditsioonilise meelelahutussektoris, kiirendades tootmistsükleid ja hõlbustades ideede loomist.
  • Isikupärastatud kogemused: ilmub kohandatud sisu, mille on kureerinud Sora vastavalt individuaalsetele eelistustele, kujundades ümber meelelahutus- ja haridusparadigmad, et need sobiksid erinevate õppimisstiilide ja -maitsetega.
  • Reaalajas kohandamine: Sora võimaldatud dünaamiline videotöötlus võimaldab sisu käigupealt muuta, rahuldada publiku eelistusi ja reaalajas tagasisidet.
  • Digitaalsete piiride hägustamine: Sora sünergia VR-i ja AR-iga hägustab piire füüsilise ja digitaalse valdkonna vahel, pakkudes uudseid kaasahaaravaid kogemusi ja interaktiivseid jutuvestmisvõimalusi.

Sisuliselt kuulutab Sora tulek muutuvat ajastut AI-põhises sisuloomes, kujundades põhjalikult ümber tööstusharud, narratiivid ja kasutajakogemused.

Kaebused

Vastavalt Usaldusprojekti juhised, pange tähele, et sellel lehel esitatud teave ei ole mõeldud ega tohiks tõlgendada kui juriidilist, maksu-, investeerimis-, finants- või muud nõuannet. Oluline on investeerida ainult seda, mida saate endale lubada kaotada, ja kahtluste korral küsida sõltumatut finantsnõu. Lisateabe saamiseks soovitame vaadata nõudeid ja tingimusi ning väljaandja või reklaamija pakutavaid abi- ja tugilehti. MetaversePost on pühendunud täpsele ja erapooletule aruandlusele, kuid turutingimusi võidakse ette teatamata muuta.

Umbes Autor

Zhauhazyn on copywriter ja sotsioloogia eriala. Olles lummatud teaduse ja tehnoloogia uuringute keerulisest dünaamikast, sukeldub ta sügavale Web3 palava kirega plokiahela vastu.

Veel artikleid
Zhauhazyn Shaden
Zhauhazyn Shaden

Zhauhazyn on copywriter ja sotsioloogia eriala. Olles lummatud teaduse ja tehnoloogia uuringute keerulisest dünaamikast, sukeldub ta sügavale Web3 palava kirega plokiahela vastu.

Institutsionaalne isu kasvab volatiilsuse tõttu Bitcoini ETF-ide poole

13F-i dokumentide kaudu avaldatud teave paljastab märkimisväärsed institutsionaalsed investorid, kes tegelevad Bitcoini ETF-idega, rõhutades, et ...

Rohkem teada

Karistuspäev saabub: CZ saatus on tasakaalus, kuna USA kohus võtab DOJ palvet arvesse

Changpeng Zhao ootab täna ees kohtuotsus USA Seattle'i kohtus.

Rohkem teada
Liituge meie uuendusliku tehnikakogukonnaga
Loe rohkem
Loe edasi
Donald Trumpi üleminek krüptotehnoloogiale: vastasest advokaadiks ja mida see USA krüptovaluutaturu jaoks tähendab
Äri turud Lood ja ülevaated Tehnoloogia
Donald Trumpi üleminek krüptotehnoloogiale: vastasest advokaadiks ja mida see USA krüptovaluutaturu jaoks tähendab
Võib 10 2024
Layer3 toob sel suvel turule L3 märgi, mis eraldab kogukonnale 51% kogupakkumisest
turud Uudiste reportaaž Tehnoloogia
Layer3 toob sel suvel turule L3 märgi, mis eraldab kogukonnale 51% kogupakkumisest
Võib 10 2024
Edward Snowdeni viimane hoiatus Bitcoini arendajatele: "Muutke privaatsus protokolli tasemel prioriteediks või riskige selle kaotamisega
turud TURVALISUS Wiki tarkvara Lood ja ülevaated Tehnoloogia
Edward Snowdeni viimane hoiatus Bitcoini arendajatele: "Muutke privaatsus protokolli tasemel prioriteediks või riskige selle kaotamisega
Võib 10 2024
Optimismi jõul töötav Ethereum Layer 2 Network Mint käivitab oma põhivõrgu 15. mail
Uudiste reportaaž Tehnoloogia
Optimismi jõul töötav Ethereum Layer 2 Network Mint käivitab oma põhivõrgu 15. mail
Võib 10 2024
CRYPTOMERIA LABS PTE. LTD.