intervija Māksla SMW
01. gada 2023. maijs

DeepFloyd un Beyond: AI mākslas jaunāko izpēti ar NightCafe Studio izpilddirektoru

Īsumā

Ekskluzīvās intervijas laikā NightCafe Studio izpilddirektors sniedza vērtīgas atziņas un perspektīvas par AI radīto mākslu.

Anguss Rasels iepazīstināja ar DeepFloyd — jaunu algoritmu, ko izstrādājis NightCafe Studio partneris, Stability AI, kas darbojas pikseļu telpā un izmanto lielas valodas modeli (LLM), lai ģenerētu attēlus.

NightCafe studija ir AI mākslas ģenerators, kas ļauj lietotājiem dažu sekunžu laikā ar mākslīgā intelekta palīdzību izveidot satriecošu un futūristisku mākslu. Dibināja Anguss Rasels Pirms četriem gadiem NightCafe Studio radās no paša Angusa neapmierinātības, jo viņš nevarēja atrast mākslas darbus, kas viņu rezonēja. Vadoties no zināšanām, ka pastāv stila pārneses algoritmi, viņš meklēja vietni, kas ļautu viņam izveidot personalizētu mākslu, izmantojot stila pārnesi un izdrukāt to. 

Viņam par vilšanos viņš nevarēja atrast šādu platformu. Tomēr šī neveiksme viņā izraisīja novatorisku ideju. Viņš nolēma izveidot neironu stila pārsūtīšanas lietotni AI radītas mākslas izveidei, un viņš to ievietoja vietnē Reddit.

NightCafe Studio radās kā teksta-attēlu ģenerēšanas platforma, padarot to par pirmo šāda veida platformu. Šī unikālā funkcija radīja ievērojamu ieņēmumu un lietotāju bāzes pieaugumu. Kopš tā laika platforma ir palikusi ģeneratīvā AI priekšgalā, piesaistot lielu entuziastu kopienu, kas ar prieku izmanto ģeneratoru, lai radītu satriecošus mākslas darbus. Mūsdienās NightCafe Studio tiek plaši uzskatīts par vienu no populārākajiem un inovatīvākajiem pieejamajiem AI attēlu ģeneratoriem.

Intervijas laikā ar Angusu Raselu mēs izpētījām mākslīgā intelekta radītās mākslas priekšrocības un ierobežojumus, arvien pieaugošo mākslīgā intelekta izmantošanu mākslas pasaulē un jaunāko AI attēlu ģenerēšanas algoritmu DeepFloyd.

naktskafejnīcas studija
Sidnejas Operas nams: viens no Angusa pirmajiem AI radītajiem attēliem

AI radītās mākslas parādīšanās

Pēdējā desmitgadē mākslas nozare ir piedzīvojusi pakāpenisku AI un mašīnmācības (ML) infiltrāciju. Šīs progresīvās tehnoloģijas ir ieviesušas dažas aizraujošas jaunas koncepcijas, piemēram, Deepfakes un DALL-E, kas ir guvuši ievērojamu uzmanību visā pasaulē. Mūsdienās mākslas nozare nevar atļauties ignorēt AI milzīgo ietekmi, kas šobrīd šajā nozarē izraisa jau sen gaidītu revolūciju.

Anguss apsprieda, kā NightCafe Studio izdošanas laikā piedzīvoja strauju izaugsmi Stable Diffusion, teksta pārveides modelis, ko viņa uzņēmums uzsāka tiešraidē palaišanas dienā. Kopš tā laika šķēršļi ienākšanai līdzīgu rīku izveidei ir pazemināti algoritmu un paraugu kodu atklātā avota dēļ.

NightCafe Studio dibinātājs uzskata, ka AI mākslas radīšana nav tikai gala produkts, bet arī tā radīšanas process. Viņš to uzskata par terapijas un relaksācijas veidu, kas ļauj cilvēkiem izpausties unikālā un radošā veidā. Daudzi cilvēki, kuri nekad nav uzskatījuši sevi par radošiem, ir atklājuši savas mākslinieciskās spējas, izmantojot mākslīgā intelekta radītos attēlus. Šī filozofija ir atspoguļota platformas lietotāja saskarnē, kas ir veidota tā, lai tā būtu lietotājam draudzīga un pieejama visu prasmju līmeņu māksliniekiem. 

Tikai vietnē NightCafe Studio jau ir divi līdz trīs miljoni lietotāju mēnesī, ģenerējot aptuveni miljonu attēlu dienā. Stability AI, atvērtā koda ģeneratīvā AI uzņēmums, Noteikts ka viņiem bija vairāk nekā 10 miljoni lietotāju, kuri bija aktīvi katru dienu neilgi pēc palaišanas Stable Diffusion.

Ieteicams: 10. gada 2023+ labākie mākslīgā intelekta mākslas ģeneratori: Midjourney, DALL-E, NightCafe, Artbreeder

DeepFloyd IF: jauns spēli mainošs AI attēlu ģenerēšanas algoritms

NightCafe Studio ievieš jaunu algoritmu ar Stability AI aicināja DeepFloyd, kas sola mainīt veidu, kā mēs ģenerējam attēlus ar mākslīgo intelektu.

DeepFloyd, kas pašlaik ir beta versijā, ir jauns teksta pārveides modelis, kas var radīt iespaidīgus attēlus no dabiskās valodas aprakstiem. Tas ir balstīts uz jaunu arhitektūru, kas apvieno lielu valodas modeli ar trim difūzijas modeļiem. Tas ir iedvesmots no Imagen — līdzīga modeļa, ko izstrādājis Google pētniecība, bet nekad nav izlaists sabiedrībai.

Modelis var ģenerēt skaidrus un saskaņotus attēlus ar tekstu un objektiem dažādās telpiskās attiecībās, kas ir izaicinošs uzdevums lielākajai daļai citu teksta-attēlu modeļu. Tas tiek panākts, izmantojot lielo valodas modeli T5-XXL-1.1 kā teksta kodētāju un ievērojamu daudzumu teksta un attēla savstarpējas uzmanības slāņu, kas nodrošina labāku uzvedņu un attēlu aliansi. 

DeepFloyd var arī izveidot attēlus ar nestandarta malu attiecību un augstu fotoreālisma pakāpi. Turklāt tas ļauj veikt nulles attēlu tulkojumus no attēla uz attēlu, kas nozīmē, ka izvades attēla stilu, modeļus un detaļas var mainīt, vienlaikus saglabājot avota attēla pamatformu bez precīzas pielāgošanas.

Jaunais algoritms darbojas savādāk nekā Stable Diffusion. DeepFloyd izmanto pikseļu vietu un lielas valodas modeli (LLM), turpretim Stable Diffusion izmanto latento telpu un fiksētu CLIP modeli. DeepFloyd attēlu izveidošanai izmanto arī vairākus difūzijas procesus Stable Diffusion izmanto tikai vienu.

DeepFloyd ir tās pētniecības grupas nosaukums, kas izveidoja algoritmu, un pats algoritms tiek saukts par IF. Pētniecības grupā ietilpst daudzi tie paši cilvēki, kas radīja GPT-3priekštecis, GPT-2, un iepriekšējais jaunākais valodas modelis ar nosaukumu RuGPT.

Dažas spekulācijas liecina, ka nosaukumu IF, iespējams, iedvesmojusi Pink Floyd dziesma ar tādu pašu nosaukumu, kā liecina algoritmu izpētes grupas sociālo mediju biogrāfiju dati.

Lasiet vairāk par algoritmu šeit.

deepfloyd naktskafejnīcas studija
Attēli, kas ģenerēti ar DeepFloyd IF. Avots: Stability AI

AI mākslas ierobežojumu un digitālās mākslas salīdzinājums

Viens no galvenajiem AI ierobežojumiem ir teksts, lai gan DeepFloyd risina šo problēmu. Vēl viens ierobežojums ir grūtības iegūt tieši tādu attēlu, kāds bija iecerēts, it īpaši bez eksperta pamudinājuma. AI arī trūkst spējas saprast un interpretēt kultūras un sociālie konteksti, kas veido cilvēka mākslu. Tāpēc mākslīgā intelekta radītā māksla dažkārt var radīt darbus, kas šķiet nevietā vai kultūras ziņā nejutīgi.

Tomēr AI radītie attēli joprojām var būt skaisti un reizēm pat labāki par sākotnējo ideju, ja vien lietotājs ir gatavs tikt pārsteigts, sacīja Anguss. Turklāt ir veidi, kā modificēt ģenerēti attēli, izmantojot AI algoritmus vai Photoshop. Lai gan precīza attēla iegūšana pašlaik ir aktīvas pētniecības joma, tiek panākts ievērojams progress. Iespējams, drīz būs iespējams pilnībā kontrolēt visus attēla aspektus. 

AI kā iedvesmas avots paļaujas uz attēliem un mākslu, kas pastāv tīmeklī, bet tikai uz tiem, uz kuriem tas tika apmācīts. Dažādi algoritmi, piemēram Midjourney, DALL-E un Stable Diffusion, ir apmācīti par dažādām datu kopām, kas nozīmē, ka tie var labāk darboties noteikta veida attēliem. 

Nesen pētnieki ir pētījuši zemas kvalitātes attēlu noņemšanas ietekmi no apmācības datu kopām, lai uzlabotu AI rezultātus. Filtrējot šos zemas kvalitātes attēlus, iegūtā datu kopa var kļūt mazāka, bet kvalitatīvāka, tādējādi nodrošinot labākus rezultātus, nepalielinot AI modeļu izmērus vai neprasot dārgāku aparatūru. Anguss dalījās, ka šī pieeja ir daudzsološs veids, kā uzlabot mākslīgā intelekta radīto attēlu kvalitāti, nepaļaujoties uz lielākiem un resursietilpīgākiem modeļiem.

Viena problēma, kas saistīta ar AI mākslā, ir tāda, ka tas var devalvēt cilvēku mākslinieku darbu, kuri pavada daudz laika mākslas radīšanai, savukārt mākslīgais intelekts spēj radīt mākslu dažu sekunžu laikā. Tomēr cilvēka mākslai ir noteikta nemateriāla kvalitāte, ko AI var būt grūti atkārtot, piemēram, emocionālais dziļums un sarežģītība, kas bieži sastopama cilvēku radītajos darbos. NightCafe Studio uzskata, ka mākslīgais intelekts ir mazāks par mākslas radīšanu komerciāliem nolūkiem, bet gan par paša radošā procesa baudīšanu.

"Cilvēku radītai mākslai vienmēr būs vērtība, jo tā atspoguļo mākslinieka pūles un prasmes, turpretim mākslīgā intelekta radītajai mākslai nav tādas pašas vērtības."

Angus teica.

Ētiska problēma, kas saistīta ar AI mākslā, ir publiska attēla izmantošana, lai apmācītu AI algoritmus, kas var nepiederēt uzņēmumam, kas apmāca AI. Lai gan pašlaik nav pārkāpti likumi, tas rada jautājumus par piekrišanu un privātumu. Atvērtā pirmkoda uzņēmumiem, piemēram OpenAI un DALL-E strādā, lai padarītu procesu ētiskāku, taču tas joprojām ir atklāts jautājums. Nākotnē var būt noteikumi par attēlu izmantošanu mākslīgā intelekta apmācīšanai mākslā.

Neskatoties uz šīm bažām, Anguss uzskata, ka mākslīgā intelekta process mākslā būtiski neatšķiras no cilvēka māksliniekiem, kas smeļas iedvesmu no citu mākslinieku darbiem. AI zina, kā lietas izskatās, un atceras attēlus, tāpat kā cilvēki. Vienkārši ir labāk tos atjaunot no jauna.

Lasīt vairāk:

Atbildības noraidīšana

Atbilstīgi Uzticības projekta vadlīnijas, lūdzu, ņemiet vērā, ka šajā lapā sniegtā informācija nav paredzēta un to nedrīkst interpretēt kā juridisku, nodokļu, ieguldījumu, finanšu vai jebkāda cita veida padomu. Ir svarīgi ieguldīt tikai to, ko varat atļauties zaudēt, un meklēt neatkarīgu finanšu padomu, ja jums ir šaubas. Lai iegūtu papildinformāciju, iesakām skatīt pakalpojumu sniegšanas noteikumus, kā arī palīdzības un atbalsta lapas, ko nodrošina izdevējs vai reklāmdevējs. MetaversePost ir apņēmies sniegt precīzus, objektīvus pārskatus, taču tirgus apstākļi var tikt mainīti bez iepriekšēja brīdinājuma.

Par Autors

Agne ir žurnāliste, kas atspoguļo jaunākās tendences un notikumus metaversā, AI un Web3 nozares Metaverse Post. Viņas aizraušanās ar stāstīšanu ir likusi viņai vadīt daudzas intervijas ar šo jomu ekspertiem, vienmēr cenšoties atklāt aizraujošus un saistošus stāstus. Agnei ir bakalaura grāds literatūrā, un viņai ir plaša pieredze rakstīšanā par dažādām tēmām, tostarp ceļošanu, mākslu un kultūru. Viņa ir arī brīvprātīgi piedalījusies par redaktori dzīvnieku tiesību organizācijā, kur palīdzējusi vairot izpratni par dzīvnieku labturības jautājumiem. Sazinieties ar viņu tālāk [e-pasts aizsargāts].

Vairāk rakstus
Agne Cimermane
Agne Cimermane

Agne ir žurnāliste, kas atspoguļo jaunākās tendences un notikumus metaversā, AI un Web3 nozares Metaverse Post. Viņas aizraušanās ar stāstīšanu ir likusi viņai vadīt daudzas intervijas ar šo jomu ekspertiem, vienmēr cenšoties atklāt aizraujošus un saistošus stāstus. Agnei ir bakalaura grāds literatūrā, un viņai ir plaša pieredze rakstīšanā par dažādām tēmām, tostarp ceļošanu, mākslu un kultūru. Viņa ir arī brīvprātīgi piedalījusies par redaktori dzīvnieku tiesību organizācijā, kur palīdzējusi vairot izpratni par dzīvnieku labturības jautājumiem. Sazinieties ar viņu tālāk [e-pasts aizsargāts].

Hot Stories
Pievienojieties mūsu informatīvajam izdevumam.
Jaunākās ziņas

Nepastāvības apstākļos institucionālā apetīte pieaug pret Bitcoin ETF

Informācijas atklāšana, izmantojot 13F pieteikumus, atklāj ievērojamus institucionālos investorus, kas iesaistās Bitcoin ETF, uzsverot pieaugošo pieņemšanu ...

Uzziniet vairāk

Pienāk notiesāšanas diena: CZ liktenis ir līdzsvarā, jo ASV tiesa izskata DOJ lūgumu

Šodien ASV tiesā Sietlā Čanpens Džao ir gatavs notiesāt.

Uzziniet vairāk
Pievienojieties mūsu novatoriskajai tehnoloģiju kopienai
Lasīt vairāk
Vairāk
Injective apvieno spēkus ar AltLayer, lai nodrošinātu atkārtotu inEVM drošību
bizness Ziņojums Tehnoloģija
Injective apvieno spēkus ar AltLayer, lai nodrošinātu atkārtotu inEVM drošību
3. gada 2024. maijs
Masa sadarbojas ar Teller, lai ieviestu MASA aizdevumu fondu, ļaujot USDC aizņemties bāzē
Markets Ziņojums Tehnoloģija
Masa sadarbojas ar Teller, lai ieviestu MASA aizdevumu fondu, ļaujot USDC aizņemties bāzē
3. gada 2024. maijs
Velodrome nākamajās nedēļās izlaiž Superchain Beta versiju un izvēršas visās OP Stack Layer 2 blokķēdes
Markets Ziņojums Tehnoloģija
Velodrome nākamajās nedēļās izlaiž Superchain Beta versiju un izvēršas visās OP Stack Layer 2 blokķēdes
3. gada 2024. maijs
CARV paziņo par sadarbību ar Aethir, lai decentralizētu savu datu slāni un sadalītu atlīdzības
bizness Ziņojums Tehnoloģija
CARV paziņo par sadarbību ar Aethir, lai decentralizētu savu datu slāni un sadalītu atlīdzības
3. gada 2024. maijs
CRYPTOMERIA LABS PTE. LTD.