interviu Menas SMW
Gali 01, 2023

„DeepFloyd and Beyond“: tyrinėkite naujausius AI meno dalykus su „NightCafe Studio“ generaliniu direktoriumi

Trumpai

Išskirtinio interviu metu „NightCafe Studio“ generalinis direktorius pateikė vertingų įžvalgų ir perspektyvų apie dirbtinio intelekto sukurtą meną.

Angusas Russellas pristatė DeepFloyd – naują algoritmą, kurį sukūrė NightCafe Studio partneris, Stability AI, kuris veikia pikselių erdvėje ir naudoja didelės kalbos modelį (LLM) vaizdams generuoti.

NightCafe studija yra AI meno generatorius, leidžiantis naudotojams dirbtinio intelekto pagalba per kelias sekundes sukurti stulbinantį ir futuristinį meną. Įkūrė Angusas Raselas Prieš ketverius metus „NightCafe Studio“ gimė iš paties Anguso nusivylimo, kad nepavyko rasti meno kūrinių, kurie jam patiktų. Vedamas žinojimo, kad egzistuoja stiliaus perkėlimo algoritmai, jis ieškojo interneto svetainės, kuri leistų sukurti asmeninį meną per stiliaus perkėlimą ir jį atspausdinti. 

Savo nusivylimui jis negalėjo rasti tokios platformos. Tačiau ši nesėkmė jam sukėlė naujovišką idėją. Jis nusprendė sukurti neuroninio stiliaus perkėlimo programą, skirtą dirbtinio intelekto sukurtam menui kurti, ir įdėjo ją į Reddit.

NightCafe Studio atsirado kaip teksto į vaizdą generavimo platforma, todėl ji yra pirmoji tokio pobūdžio platforma. Ši unikali funkcija labai padidino pajamas ir vartotojų bazę. Nuo tada platforma išliko generatyvaus AI priešakyje, pritraukdama didelę entuziastų bendruomenę, kuri naudojasi generatoriumi, kad sukurtų nuostabius meno kūrinius. Šiandien NightCafe Studio yra plačiai vertinamas kaip vienas populiariausių ir novatoriškiausių AI vaizdo generatorių.

Interviu su Angus Russell metu tyrinėjome dirbtinio intelekto sukurto meno naudą ir apribojimus, vis didesnį dirbtinio intelekto naudojimą meno pasaulyje ir naujausią AI vaizdų generavimo algoritmą „DeepFloyd“.

naktinės kavinės studija
Sidnėjaus operos teatras: vienas pirmųjų Anguso AI sukurtų vaizdų

AI sukurto meno atsiradimas

Per pastarąjį dešimtmetį meno pramonė stebėjo laipsnišką AI ir mašininio mokymosi (ML) infiltraciją. Šios pažangiausios technologijos pristatė keletą patrauklių naujų sąvokų, pvz., Deepfakes ir DALL-E, kurios sulaukė didelio dėmesio visame pasaulyje. Šiandien meno pramonė negali sau leisti nepaisyti didžiulio AI poveikio, kuris dabar sukelia seniai lauktą revoliuciją šiame sektoriuje.

Angusas aptarė, kaip „NightCafe Studio“ išleidimo metu patyrė augimo šuolius Stable Diffusion, teksto į vaizdą modelis, su kuriuo jo įmonė pradėjo veikti pristatymo dieną. Nuo tada įėjimo kliūtis kuriant panašius įrankius sumažėjo dėl atvirojo algoritmų ir pavyzdinių kodų šaltinio.

„NightCafe Studio“ įkūrėjas mano, kad dirbtinio intelekto meno kūrimas yra ne tik galutinis produktas, bet ir jo kūrimo procesas. Jis tai vertina kaip terapijos ir atsipalaidavimo formą, leidžiančią žmonėms išreikšti save unikaliais ir kūrybiškais būdais. Daugelis žmonių, kurie niekada nelaikė savęs kūrybingais, savo meninius sugebėjimus atrado pasitelkę dirbtinio intelekto sukurtus vaizdus. Ši filosofija atsispindi platformos vartotojo sąsajoje, kuri sukurta taip, kad būtų patogi ir prieinama visų lygių menininkams. 

Vien „NightCafe Studio“ jau yra nuo dviejų iki trijų milijonų vartotojų per mėnesį ir sukuria apie milijoną vaizdų per dieną. Stability AI, atvirojo kodo generuojanti dirbtinio intelekto įmonė, pareiškė, kad jie turėjo daugiau nei 10 milijonų vartotojų, kurie buvo aktyvūs kasdien netrukus po paleidimo Stable Diffusion.

Rekomenduojama: Daugiau nei 10 geriausių 2023 m. AI meno generatorių: Midjourney, DALL-E, NightCafe, Artbreeder

DeepFloyd IF: naujas žaidimą keičiantis AI vaizdo generavimo algoritmas

„NightCafe Studio“ diegia naują algoritmą Stability AI vadinamas DeepFloyd, kuris žada pakeisti tai, kaip mes generuojame vaizdus dirbtinio intelekto pagalba.

DeepFloyd, kuri šiuo metu yra beta versija, yra naujas teksto į vaizdą modelis, galintis sukurti įspūdingus vaizdus iš natūralios kalbos aprašymų. Jis pagrįstas nauja architektūra, kurioje didelis kalbos modelis derinamas su trimis sklaidos modeliais. Jį įkvėpė „Imagen“ – panašus modelis, kurį sukūrė „Google Research“, bet niekada nebuvo paskelbtas visuomenei.

Modelis gali generuoti aiškius ir nuoseklius vaizdus su tekstu ir objektais įvairiuose erdviniuose santykiuose, o tai yra sudėtinga užduotis daugeliui kitų teksto į vaizdą modelių. Tai pasiekiama naudojant didelės kalbos modelį T5-XXL-1.1 kaip teksto kodavimo priemonę ir daug teksto vaizdo kryžminio dėmesio sluoksnių, kurie užtikrina geresnį greitų ir vaizdų derinį. 

„DeepFloyd“ taip pat gali kurti vaizdus su nestandartiniu formato santykiu ir turi aukštą fotorealizmo laipsnį. Be to, tai leidžia nulinio kadro vaizdo vertimą į vaizdą, o tai reiškia, kad išvesties vaizdo stilių, modelius ir detales galima keisti išlaikant pagrindinę pirminio vaizdo formą, nereikia koreguoti.

Naujasis algoritmas veikia kitaip nei Stable Diffusion. Tuo tarpu „DeepFloyd“ naudoja pikselių erdvę ir didelės kalbos modelį (LLM). Stable Diffusion naudoja latentinę erdvę ir fiksuotą CLIP modelį. „DeepFloyd“ taip pat naudoja kelis difuzijos procesus vaizdams kurti Stable Diffusion naudoja tik vieną.

„DeepFloyd“ yra tyrimo grupės, sukūrusios algoritmą, pavadinimas, o pats algoritmas vadinamas IF. Tyrimo grupėje yra daug tų pačių žmonių, kurie kūrė GPT-3pirmtakas, GPT-2ir ankstesnį naujausią kalbos modelį, pavadintą RuGPT.

Kai kurios spėlionės rodo, kad pavadinimas IF gali būti įkvėptas to paties pavadinimo „Pink Floyd“ dainos, kaip užsimenama algoritmų tyrimo grupės socialinės žiniasklaidos biografijoje.

Skaitykite daugiau apie algoritmą čia.

Deepfloyd naktinės kavinės studija
Vaizdai sukurti naudojant DeepFloyd IF. Šaltinis: Stability AI

AI meno apribojimų ir skaitmeninio meno palyginimas

Vienas iš pagrindinių AI apribojimų yra tekstas, nors „DeepFloyd“ sprendžia šią problemą. Kitas apribojimas yra tai, kad sunku gauti tiksliai tokį vaizdą, koks buvo numatytas, ypač be eksperto raginimo. AI taip pat neturi gebėjimo suprasti ir interpretuoti kultūriniai ir socialiniai kontekstai, formuojantys žmogaus meną. Todėl dirbtinio intelekto sukurtas menas kartais gali sukurti kūrinius, kurie atrodo netinkami arba kultūriškai nejautrūs.

Tačiau dirbtinio intelekto sukurti vaizdai vis tiek gali būti gražūs ir kartais net geresni už pradinę idėją, jei vartotojas gali būti nustebintas, sakė Angusas. Be to, yra būdų, kaip pakeisti sugeneruoti vaizdai naudojant AI algoritmus arba „Photoshop“.. Nors tikslaus vaizdo gavimas šiuo metu yra aktyvių tyrimų sritis, daroma didelė pažanga. Greitai gali būti įmanoma visiškai kontroliuoti kiekvieną vaizdo aspektą. 

Dirbtinis intelektas kaip įkvėpimas remiasi vaizdais ir menu, kurie yra žiniatinklyje, bet tik tais, kuriais jis buvo išmokytas. Įvairūs algoritmai, pvz Midjourney, DALL-E ir Stable Diffusion, yra išmokyti naudoti skirtingus duomenų rinkinius, o tai reiškia, kad jie gali geriau veikti tam tikrų tipų vaizduose. 

Neseniai mokslininkai tiria žemos kokybės vaizdų pašalinimo iš mokymo duomenų rinkinių poveikį, kad pagerintų AI rezultatus. Išfiltravus šiuos žemos kokybės vaizdus, ​​gaunamas duomenų rinkinys gali tapti mažesnis, bet aukštesnės kokybės, todėl bus pasiekti geresni rezultatai, nepadidinant AI modelių dydžio ir nereikalaujant brangesnės aparatinės įrangos. Angusas pasidalijo, kad šis metodas yra daug žadantis būdas pagerinti dirbtinio intelekto sukurtų vaizdų kokybę nepasikliaujant didesniais ir daug išteklių reikalaujančiais modeliais.

Viena problema, susijusi su AI mene, yra ta, kad jis gali nuvertinti žmonių menininkų, kurie daug laiko praleidžia kurdami meną, darbą, o AI gali sukurti meną per kelias sekundes. Tačiau žmogaus menas turi tam tikrą neapčiuopiamą kokybę, kurią dirbtiniu intelektu gali būti sunku atkartoti, pavyzdžiui, emocinis gylis ir sudėtingumas, dažnai būdingi žmogaus kuriamuose darbuose. „NightCafe Studio“ mano, kad dirbtinis intelektas yra mažiau susijęs su meno kūrimu komerciniais tikslais, o su malonumu pačiu kūrybiniu procesu.

„Žmogaus sukurtas menas visada bus vertingas, nes jis atspindi menininko pastangas ir įgūdžius, o dirbtinio intelekto sukurtas menas neturi tokios pačios vidinės vertės.

Angusas pasakė.

Etinė problema, susijusi su DI meno srityje, yra viešo vaizdo naudojimas mokant dirbtinio intelekto algoritmus, kurie gali nepriklausyti AI rengiančiai įmonei. Nors šiuo metu nėra pažeistų įstatymų, kyla klausimų dėl sutikimo ir privatumo. Atvirojo kodo įmonės kaip OpenAI ir DALL-E stengiasi, kad procesas taptų etiškesnis, tačiau tai lieka atviras klausimas. Ateityje gali būti taikomos taisyklės dėl vaizdų naudojimo mokant dirbtinį intelektą meno srityje.

Nepaisant šių rūpesčių, Angusas mano, kad AI procesas mene iš esmės nesiskiria nuo žmonių menininkų, kurie semiasi įkvėpimo iš kitų menininkų darbų. AI žino, kaip viskas atrodo, ir atsimena vaizdų dalis, kaip ir žmonės. Tiesiog geriau juos atkurti nuo nulio.

Plačiau paskaitykite čia:

Atsakomybės neigimas

Remdamasi tuo, Pasitikėjimo projekto gairės, atkreipkite dėmesį, kad šiame puslapyje pateikta informacija nėra skirta ir neturėtų būti aiškinama kaip teisinė, mokesčių, investicinė, finansinė ar bet kokia kita konsultacija. Svarbu investuoti tik tai, ką galite sau leisti prarasti, ir, jei turite kokių nors abejonių, kreiptis į nepriklausomą finansinę konsultaciją. Norėdami gauti daugiau informacijos, siūlome peržiūrėti taisykles ir nuostatas bei pagalbos ir palaikymo puslapius, kuriuos pateikia išdavėjas arba reklamuotojas. MetaversePost yra įsipareigojusi teikti tikslias, nešališkas ataskaitas, tačiau rinkos sąlygos gali keistis be įspėjimo.

Apie autorių

Agnė yra žurnalistė, kuri pasakoja apie naujausias tendencijas ir pokyčius metaverse, AI ir Web3 pramonės šakoms Metaverse Post. Jos aistra pasakojimui paskatino ją vesti daugybę interviu su šių sričių ekspertais, visada siekdama atskleisti įdomių ir įtraukiančių istorijų. Agnė yra įgijusi literatūros bakalauro laipsnį ir daug rašo įvairiomis temomis, įskaitant keliones, meną ir kultūrą. Ji taip pat savanoriavo gyvūnų teisių organizacijos redaktore, kur padėjo didinti informuotumą apie gyvūnų gerovės problemas. Susisiekite su ja [apsaugotas el. paštu].

Daugiau straipsnių
Agnė Cimerman
Agnė Cimerman

Agnė yra žurnalistė, kuri pasakoja apie naujausias tendencijas ir pokyčius metaverse, AI ir Web3 pramonės šakoms Metaverse Post. Jos aistra pasakojimui paskatino ją vesti daugybę interviu su šių sričių ekspertais, visada siekdama atskleisti įdomių ir įtraukiančių istorijų. Agnė yra įgijusi literatūros bakalauro laipsnį ir daug rašo įvairiomis temomis, įskaitant keliones, meną ir kultūrą. Ji taip pat savanoriavo gyvūnų teisių organizacijos redaktore, kur padėjo didinti informuotumą apie gyvūnų gerovės problemas. Susisiekite su ja [apsaugotas el. paštu].

Institucinis apetitas Bitcoin ETF atžvilgiu auga dėl nepastovumo

13F paraiškų atskleidimas atskleidžia žymius institucinius investuotojus, kurie naudojasi Bitcoin ETF, o tai rodo, kad vis labiau pritariama...

Žinoti daugiau

Ateina nuosprendžio paskelbimo diena: CZ likimas subalansuotas, nes JAV teismas svarsto DOJ prašymą

Changpeng Zhao šiandien laukia nuosprendžio JAV teisme Sietle.

Žinoti daugiau
Prisijunkite prie mūsų naujoviškų technologijų bendruomenės
Skaityti daugiau
Skaityti daugiau
Injective sujungia jėgas su AltLayer, kad padidintų inEVM saugumą
Atsakingas verslas Naujienų ataskaita Technologija
Injective sujungia jėgas su AltLayer, kad padidintų inEVM saugumą
Gali 3, 2024
„Masa“ bendradarbiauja su „Teller“, kad pristatytų MASA skolinimo fondą, leidžiantį skolintis USDC pagrindu
rinkos Naujienų ataskaita Technologija
„Masa“ bendradarbiauja su „Teller“, kad pristatytų MASA skolinimo fondą, leidžiantį skolintis USDC pagrindu
Gali 3, 2024
„Velodrome“ ateinančiomis savaitėmis pristato „Superchain“ beta versiją ir išplečiama visose „OP Stack Layer 2 Blockchains“
rinkos Naujienų ataskaita Technologija
„Velodrome“ ateinančiomis savaitėmis pristato „Superchain“ beta versiją ir išplečiama visose „OP Stack Layer 2 Blockchains“
Gali 3, 2024
CARV praneša apie partnerystę su Aethir, kad decentralizuotų savo duomenų sluoksnį ir paskirstytų atlygį
Atsakingas verslas Naujienų ataskaita Technologija
CARV praneša apie partnerystę su Aethir, kad decentralizuotų savo duomenų sluoksnį ir paskirstytų atlygį
Gali 3, 2024
CRYPTOMERIA LABS PTE. LTD.