Intervju Umjetnost SMW
Neka 01, 2023

DeepFloyd i šire: istražujući najnovije u umjetnoj inteligenciji s izvršnim direktorom NightCafe Studio

Ukratko

Tijekom ekskluzivnog intervjua, izvršni direktor NightCafe Studija pružio je vrijedne uvide i perspektive o umjetnosti generiranoj umjetnom inteligencijom.

Angus Russell predstavio je DeepFloyd – novi algoritam koji je razvio partner NightCafe Studija, Stability AI, koji radi u prostoru piksela i koristi Large Language Model (LLM) za generiranje slika.

NightCafe Studio je AI Art Generator koji korisnicima omogućuje stvaranje zapanjujuće i futurističke umjetnosti u nekoliko sekundi uz pomoć umjetne inteligencije. Osnovao Angus Russell Prije četiri godine, NightCafe Studio rođen je iz Angusove vlastite frustracije jer nije mogao pronaći umjetnička djela koja bi mu se svidjela. Vođen spoznajom da algoritmi za prijenos stila postoje, tražio je web stranicu koja bi mu omogućila stvaranje personalizirane umjetnosti prijenosom stila i njezin ispis. 

Na svoje razočaranje, nije mogao pronaći takvu platformu. Međutim, ovaj neuspjeh potaknuo je u njemu inovativnu ideju. Odlučio je stvoriti aplikaciju za prijenos neuronskih stilova za stvaranje umjetnosti generirane umjetnom inteligencijom i postavio ju je na Reddit.

NightCafe Studio nastao je kao platforma za generiranje teksta u sliku, što ga čini prvim te vrste. Ova jedinstvena značajka donijela je značajan porast prihoda i baze korisnika. Od tada je platforma ostala na čelu generativne umjetne inteligencije, privlačeći veliku zajednicu entuzijasta koji uživaju u korištenju generatora za stvaranje zapanjujućih umjetničkih djela. Danas se NightCafe Studio smatra jednim od najpopularnijih i najinovativnijih dostupnih AI generatora slika.

Tijekom intervjua s Angusom Russellom istražili smo prednosti i ograničenja umjetnosti generirane umjetnom inteligencijom, sve veću upotrebu umjetne inteligencije u svijetu umjetnosti i najnoviji algoritam za generiranje slika umjetnom inteligencijom, DeepFloyd.

noćni kafić studio
Sydney Opera House: Jedna od Angusovih prvih slika generiranih umjetnom inteligencijom

Pojava umjetnosti generirane umjetnom inteligencijom

U posljednjem desetljeću umjetnička je industrija svjedočila postupnoj infiltraciji umjetne inteligencije i strojnog učenja (ML). Ove vrhunske tehnologije uvele su neke fascinantne nove koncepte, kao što su Deepfakes i DALL-E, koji su pridobili značajnu pozornost diljem svijeta. Danas si umjetnička industrija ne može priuštiti ignoriranje golemog utjecaja umjetne inteligencije, koja sada pokreće dugo očekivanu revoluciju u sektoru.

Angus je govorio o tome kako je NightCafe Studio doživio skokove rasta tijekom izdavanja Stable Diffusion, model teksta u sliku s kojim je njegova tvrtka puštena u rad na dan lansiranja. Od tada je barijera za ulazak u stvaranje sličnih alata smanjena zbog otvorenog izvornog koda algoritama i uzoraka kodova.

Osnivač NightCafe Studija vjeruje da se stvaranje AI umjetnosti ne odnosi samo na krajnji proizvod, već i na proces njegovog stvaranja. On to vidi kao oblik terapije i opuštanja, dopuštajući ljudima da se izraze na jedinstvene i kreativne načine. Mnogi ljudi koji se nikada nisu smatrali kreativnima otkrili su svoje umjetničke sposobnosti kroz slike koje je generirala umjetna inteligencija. Ova se filozofija odražava u korisničkom sučelju platforme koje je dizajnirano da bude jednostavno i dostupno umjetnicima svih razina vještina. 

Samo na NightCafe Studiju već ima između dva i tri milijuna korisnika mjesečno, koji generiraju oko milijun slika dnevno. Stability AI, generativna AI tvrtka otvorenog koda, navedeno da su imali preko 10 milijuna korisnika koji su bili aktivni dnevno nedugo nakon pokretanja Stable Diffusion.

Preporučena: 10+ najboljih AI umjetničkih generatora 2023.: Midjourney, DALL-E, NightCafe, Artbreeder

DeepFloyd IF: Novi algoritam za generiranje AI slike koji mijenja igru

NightCafe Studio implementira novi algoritam od strane Stability AI zvan DeepFloyd, koji obećava revoluciju u načinu na koji generiramo slike pomoću umjetne inteligencije.

DeepFloyd, koji je trenutno u beta verziji, novi je model pretvaranja teksta u sliku koji može generirati impresivne slike iz opisa prirodnog jezika. Temelji se na novoj arhitekturi koja kombinira veliki jezični model s tri difuzijska modela. Inspiriran je Imagenom, sličnim modelom koji je razvio Google Research, ali nikada nije objavljen u javnosti.

Model može generirati jasne i koherentne slike s tekstom i objektima u različitim prostornim odnosima, što je izazovan zadatak za većinu drugih modela teksta u sliku. To se postiže upotrebom velikog jezičnog modela T5-XXL-1.1 kao kodera teksta i značajne količine slojeva unakrsne pozornosti između teksta i slike koji pružaju bolji brzi i slikovni savez. 

DeepFloyd također može stvarati slike s nestandardnim omjerom i ima visok stupanj fotorealizma. Osim toga, omogućuje zero-shot prevođenje slike u sliku, što znači da se stil, uzorci i detalji izlazne slike mogu mijenjati uz zadržavanje osnovnog oblika izvorne slike bez potrebe za finim podešavanjem.

Novi algoritam radi na drugačiji način od Stable Diffusion. DeepFloyd koristi prostor piksela i Large Language Model (LLM), dok Stable Diffusion koristi latentni prostor i fiksni CLIP model. DeepFloyd također koristi višestruke procese difuzije za stvaranje slika, dok Stable Diffusion koristi samo jedan.

DeepFloyd je naziv istraživačke grupe koja je izradila algoritam, a sam algoritam se zove IF. Istraživačka skupina uključuje mnogo istih ljudi koji su stvarali GPT-3njegov prethodnik, GPT-2, i prethodni najsuvremeniji jezični model pod nazivom RuGPT.

Neke spekulacije sugeriraju da bi naziv IF mogao biti inspiriran istoimenom pjesmom Pink Floyda, kao što je nagoviješteno u biografijama grupe za istraživanje algoritama na društvenim mrežama.

Pročitajte više o algoritmu ovdje.

studio deepfloy nightcafe
Slike generirane s DeepFloyd IF. Izvor: Stability AI

Usporedba umjetničkih ograničenja umjetne inteligencije i digitalne umjetnosti

Jedno od glavnih ograničenja umjetne inteligencije je tekst, iako se DeepFloyd bavi tim problemom. Još jedno ograničenje je teškoća dobivanja slike točno onako kako je zamišljena, osobito bez savjeta stručnjaka. AI također nema sposobnost razumijevanja i tumačenja kulturni i društveni konteksti koji oblikuju ljudsku umjetnost. Stoga umjetnost generirana umjetnom inteligencijom ponekad može proizvesti djela koja se čine neumjesnim ili kulturološki neosjetljivima.

Međutim, slike generirane umjetnom inteligencijom i dalje mogu biti lijepe, a ponekad čak i bolje od izvorne ideje, sve dok je korisnik otvoren za iznenađenje, rekao je Angus. Osim toga, postoje načini za izmjenu generirane slike pomoću AI algoritama ili Photoshopa. Iako je dobivanje točne slike trenutno područje aktivnog istraživanja, ostvaren je značajan napredak. Uskoro bi moglo biti moguće imati potpunu kontrolu nad svakim aspektom slike. 

AI se kao inspiracija oslanja na slike i umjetnost koji postoje na webu, ali samo na one na kojima je trenirao. Različiti algoritmi, kao npr Midjourney, DALL-E i Stable Diffusion, uvježbani su na različitim skupovima podataka, što znači da bi mogli bolje funkcionirati na određenim vrstama slika. 

Nedavno su istraživači istraživali utjecaj uklanjanja slika niske kvalitete iz skupova podataka za obuku na poboljšanje rezultata umjetne inteligencije. Filtriranjem tih slika niske kvalitete, dobiveni skup podataka može postati manji, ali kvalitetniji, što dovodi do boljih rezultata bez povećanja veličine AI modela ili zahtijevanja skupljeg hardvera. Angus je podijelio da ovaj pristup predstavlja obećavajući način za poboljšanje kvalitete slika generiranih umjetnom inteligencijom bez oslanjanja na veće modele koji zahtijevaju više resursa.

Jedan problem s umjetnom inteligencijom u umjetnosti je da može obezvrijediti rad ljudskih umjetnika koji provode puno vremena stvarajući umjetnost, dok umjetna inteligencija može generirati umjetnost u nekoliko sekundi. Međutim, postoji određena nematerijalna kvaliteta ljudske umjetnosti koju bi umjetna inteligencija mogla teško reproducirati, poput emocionalne dubine i složenosti često prisutnih u djelima koja su stvorili ljudi. NightCafe Studio vjeruje da se AI manje bavi stvaranjem umjetnosti u komercijalne svrhe, a više uživanjem u samom kreativnom procesu.

“U umjetnosti koju su izradili ljudi uvijek će postojati vrijednost jer ona predstavlja trud i vještinu umjetnika, dok umjetnost koju stvara umjetna inteligencija nema istu intrinzičnu vrijednost.”

Rekao je Angus.

Etičko pitanje koje okružuje umjetnu inteligenciju u umjetnosti je korištenje javne slike za treniranje algoritama umjetne inteligencije koji možda ne pripadaju tvrtki koja trenira umjetnu inteligenciju. Iako trenutno nema kršenja zakona, postavlja se pitanja o pristanku i privatnosti. Tvrtke otvorenog koda poput OpenAI i DALL-E rade na tome da proces učine etičnijim, ali to ostaje otvoreno pitanje. Možda će postojati budući propisi koji se odnose na korištenje slika za treniranje umjetne inteligencije u umjetnosti.

Unatoč tim zabrinutostima, Angus vjeruje da se proces umjetne inteligencije u umjetnosti ne razlikuje bitno od umjetnika koji crpe inspiraciju iz djela drugih umjetnika. AI zna kako stvari izgledaju i pamti dijelove slika, baš kao i ljudi. Jednostavno ih je bolje ponovno stvoriti od nule.

Pročitajte više:

Izjava o odricanju od odgovornosti

U skladu s Smjernice projekta povjerenja, imajte na umu da informacije navedene na ovoj stranici nemaju namjeru i ne smiju se tumačiti kao pravni, porezni, investicijski, financijski ili bilo koji drugi oblik savjeta. Važno je ulagati samo ono što si možete priuštiti izgubiti i potražiti neovisni financijski savjet ako imate bilo kakvih nedoumica. Za dodatne informacije predlažemo da pogledate odredbe i uvjete, kao i stranice za pomoć i podršku koje pruža izdavatelj ili oglašivač. MetaversePost je predan točnom, nepristranom izvješćivanju, ali tržišni uvjeti podložni su promjenama bez prethodne najave.

O autoru

Agne je novinarka koja pokriva najnovije trendove i razvoj u metaverzumu, umjetnoj inteligenciji i Web3 industrije za Metaverse Post. Njezina strast za pripovijedanjem dovela ju je do brojnih intervjua sa stručnjacima u tim područjima, uvijek nastojeći otkriti uzbudljive i privlačne priče. Agne je diplomirala književnost i ima opsežno iskustvo u pisanju o širokom rasponu tema, uključujući putovanja, umjetnost i kulturu. Također je volontirala kao urednica organizacije za prava životinja, gdje je pomogla u podizanju svijesti o pitanjima dobrobiti životinja. Kontaktirajte je na [e-pošta zaštićena].

Više članaka
Agne Cimerman
Agne Cimerman

Agne je novinarka koja pokriva najnovije trendove i razvoj u metaverzumu, umjetnoj inteligenciji i Web3 industrije za Metaverse Post. Njezina strast za pripovijedanjem dovela ju je do brojnih intervjua sa stručnjacima u tim područjima, uvijek nastojeći otkriti uzbudljive i privlačne priče. Agne je diplomirala književnost i ima opsežno iskustvo u pisanju o širokom rasponu tema, uključujući putovanja, umjetnost i kulturu. Također je volontirala kao urednica organizacije za prava životinja, gdje je pomogla u podizanju svijesti o pitanjima dobrobiti životinja. Kontaktirajte je na [e-pošta zaštićena].

Institucionalni apetit raste prema Bitcoin ETF-ovima usred volatilnosti

Objave putem 13F prijava otkrivaju značajne institucionalne ulagače koji se upuštaju u Bitcoin ETF-ove, naglašavajući sve veće prihvaćanje ...

Znati više

Stiže dan izricanja presude: CZ-ova sudbina visi na ravnoteži dok američki sud razmatra izjavu DOJ-a

Changpeng Zhao danas će se suočiti s kaznom na američkom sudu u Seattleu.

Znati više
Pridružite se našoj zajednici inovativnih tehnologija
opširnije
Čitaj više
Injective udružuje snage s AltLayerom kako bi unio sigurnost ponovnog postavljanja na inEVM
posao Vijesti Tehnologija
Injective udružuje snage s AltLayerom kako bi unio sigurnost ponovnog postavljanja na inEVM
Neka 3, 2024
Masa se udružuje s Tellerom kako bi uveli MASA Lending Pool, omogućujući USDC posuđivanje na bazi
tržišta Vijesti Tehnologija
Masa se udružuje s Tellerom kako bi uveli MASA Lending Pool, omogućujući USDC posuđivanje na bazi
Neka 3, 2024
Velodrome lansira Superchain Beta verziju u nadolazećim tjednima i proširuje se na OP Stack Layer 2 Blockchains
tržišta Vijesti Tehnologija
Velodrome lansira Superchain Beta verziju u nadolazećim tjednima i proširuje se na OP Stack Layer 2 Blockchains
Neka 3, 2024
CARV najavljuje partnerstvo s Aethirom za decentralizaciju svog podatkovnog sloja i distribuciju nagrada
posao Vijesti Tehnologija
CARV najavljuje partnerstvo s Aethirom za decentralizaciju svog podatkovnog sloja i distribuciju nagrada
Neka 3, 2024
CRYPTOMERIA LABS PTE. LTD.