Intervju Umetnost SMW
Maj 01, 2023

DeepFloyd and Beyond: Raziskovanje najnovejše umetnosti umetne inteligence z izvršnim direktorjem studia NightCafe

Na kratko

Med ekskluzivnim intervjujem je izvršni direktor NightCafe Studio ponudil dragocene vpoglede in poglede na umetnost, ki jo ustvarja umetna inteligenca.

Angus Russell je predstavil DeepFloyd – nov algoritem, ki ga je razvil partner studia NightCafe, Stability AI, ki deluje v prostoru slikovnih pik in uporablja Large Language Model (LLM) za ustvarjanje slik.

Studio NightCafe je AI Art Generator, ki uporabnikom omogoča ustvarjanje osupljive in futuristične umetnosti v nekaj sekundah s pomočjo umetne inteligence. Ustanovil Angus Russell pred štirimi leti se je NightCafe Studio rodil iz Angusove lastne frustracije, ker ni mogel najti umetniških del, ki bi mu ustrezala. Ker je vedel, da obstajajo algoritmi za prenos sloga, je iskal spletno mesto, ki bi mu omogočilo ustvarjanje personalizirane umetnosti s prenosom sloga in njegovo tiskanje. 

Na njegovo razočaranje ni mogel najti takšne platforme. Vendar je ta neuspeh v njem sprožil inovativno idejo. Odločil se je ustvariti aplikacijo za prenos živčnega sloga za ustvarjanje umetnosti, ustvarjene z umetno inteligenco, in jo je objavil na Redditu.

NightCafe Studio je nastal kot platforma za ustvarjanje besedila v sliko, zaradi česar je prvi te vrste. Ta edinstvena funkcija je povzročila znaten porast prihodkov in baze uporabnikov. Od takrat je platforma ostala v ospredju generativne umetne inteligence in privablja veliko skupnost navdušencev, ki z veseljem uporabljajo generator za ustvarjanje osupljivih umetnin. Danes NightCafe Studio na splošno velja za enega najbolj priljubljenih in inovativnih razpoložljivih generatorjev slik z umetno inteligenco.

Med intervjujem z Angusom Russellom smo raziskali prednosti in omejitve umetnosti, ustvarjene z umetno inteligenco, vse večjo uporabo umetne inteligence v svetu umetnosti in najnovejši algoritem za ustvarjanje slik z umetno inteligenco, DeepFloyd.

studio nočne kavarne
Sydneyjska operna hiša: Ena od Angusovih prvih slik, ustvarjenih z umetno inteligenco

Pojav umetnosti, ki jo je ustvarila umetna inteligenca

V zadnjem desetletju je bila umetnostna industrija priča postopni infiltraciji umetne inteligence in strojnega učenja (ML). Te vrhunske tehnologije so predstavile nekaj zanimivih novih konceptov, kot so Deepfakes in DALL-E, ki so pritegnile veliko pozornosti po vsem svetu. Danes si umetniška industrija ne more privoščiti, da bi prezrla neizmerni vpliv umetne inteligence, ki zdaj sproža že dolgo pričakovano revolucijo v sektorju.

Angus je razpravljal o tem, kako je NightCafe Studio doživel skokovite rasti med izdajo Stable Diffusion, model besedila v sliko, s katerim je njegovo podjetje začelo delovati na dan predstavitve. Od takrat se je vstopna ovira za ustvarjanje podobnih orodij znižala zaradi odprtokodnosti algoritmov in vzorčnih kod.

Ustanovitelj studia NightCafe je prepričan, da pri ustvarjanju umetnosti z umetno inteligenco ne gre le za končni izdelek, temveč tudi za proces njegovega ustvarjanja. Vidi ga kot obliko terapije in sprostitve, ki ljudem omogoča, da se izrazijo na edinstven in ustvarjalen način. Mnogi ljudje, ki se nikoli niso imeli za ustvarjalne, so svoje umetniške sposobnosti odkrili v slikah, ustvarjenih z umetno inteligenco. Ta filozofija se odraža v uporabniškem vmesniku platforme, ki je zasnovan tako, da je uporabniku prijazen in dostopen umetnikom vseh ravni znanja. 

Samo na NightCafe Studio je že med dva in tri milijone uporabnikov na mesec, ki ustvarijo okoli milijon slik na dan. Stability AI, odprtokodno generativno podjetje z umetno inteligenco, navedla da so imeli več kot 10 milijonov uporabnikov, ki so bili aktivni dnevno kmalu po lansiranju Stable Diffusion.

Priporočamo: 10+ najboljših umetniških generatorjev AI leta 2023: Midjourney, DALL-E, NightCafe, Artbreeder

DeepFloyd IF: nov algoritem za ustvarjanje slik z umetno inteligenco, ki spreminja igre

NightCafe Studio uvaja nov algoritem s strani Stability AI se imenuje DeepFloyd, ki obljublja, da bo spremenil način ustvarjanja slik z umetno inteligenco.

DeepFloyd, ki je trenutno v beta različici, je nov model besedila v sliko, ki lahko ustvari impresivne slike iz opisov v naravnem jeziku. Temelji na novi arhitekturi, ki združuje velik jezikovni model s tremi difuzijskimi modeli. Navdihuje ga Imagen, podoben model, ki ga je razvila Google Research, vendar ni bil nikoli objavljen v javnosti.

Model lahko ustvari jasne in koherentne slike z besedilom in predmeti v različnih prostorskih razmerjih, kar je zahtevna naloga za večino drugih modelov besedila v sliko. To je doseženo z uporabo velikega jezikovnega modela T5-XXL-1.1 kot kodirnika besedila in znatne količine slojev navzkrižne pozornosti med besedilom in sliko, ki zagotavljajo boljše hitro in slikovno zavezništvo. 

DeepFloyd lahko ustvari tudi slike z nestandardnim razmerjem stranic in ima visoko stopnjo fotorealizma. Poleg tega omogoča prevajanje slike v sliko z ničelnim posnetkom, kar pomeni, da je mogoče spremeniti slog, vzorce in podrobnosti izhodne slike, hkrati pa ohraniti osnovno obliko izvorne slike brez potrebe po natančnem prilagajanju.

Novi algoritem deluje drugače kot Stable Diffusion. DeepFloyd uporablja prostor slikovnih pik in Large Language Model (LLM), medtem ko Stable Diffusion uporablja latentni prostor in fiksni model CLIP. DeepFloyd uporablja tudi več procesov difuzije za ustvarjanje slik, medtem ko Stable Diffusion uporablja samo enega.

DeepFloyd je ime raziskovalne skupine, ki je zgradila algoritem, sam algoritem pa se imenuje IF. V raziskovalni skupini je veliko istih ljudi, ki so ustvarjali GPT-3njegov predhodnik, GPT-2, in prejšnji najsodobnejši jezikovni model, imenovan RuGPT.

Nekatere špekulacije kažejo, da je ime IF morda navdihnila istoimenska pesem skupine Pink Floyd, kot namigujejo biografije skupine za raziskovanje algoritmov na družbenih medijih.

Preberite več o algoritmu tukaj.

studio deepfloy nightcafe
Slike, ustvarjene z DeepFloyd IF. Vir: Stability AI

Primerjava umetniških omejitev AI in digitalne umetnosti

Ena glavnih omejitev umetne inteligence je besedilo, čeprav DeepFloyd rešuje to težavo. Druga omejitev je težava pri pridobivanju slike, ki je natanko takšna, kot je bila predvidena, zlasti brez nasveta strokovnjaka. AI tudi nima sposobnosti razumevanja in interpretacije kulturni in družbeni konteksti, ki oblikujejo človeško umetnost. Zato lahko umetnost, ki jo ustvari umetna inteligenca, včasih proizvede dela, ki se zdijo neumestna ali kulturno neobčutljiva.

Vendar pa so lahko slike, ustvarjene z umetno inteligenco, še vedno lepe in včasih celo boljše od prvotne zamisli, če je uporabnik pripravljen biti presenečen, je dejal Angus. Poleg tega obstajajo načini za spreminjanje ustvarjene slike z algoritmi AI ali Photoshop. Medtem ko je pridobivanje natančne slike trenutno področje aktivnih raziskav, je bil dosežen pomemben napredek. Morda bo kmalu mogoče imeti popoln nadzor nad vsemi vidiki slike. 

Umetna inteligenca se kot navdih opira na slike in umetnost, ki obstajajo na spletu, vendar le na tiste, na katerih se je učila. Različni algoritmi, kot npr Midjourney, DALL-E in Stable Diffusion, so usposobljeni za različne nabore podatkov, kar pomeni, da so morda boljši pri določenih vrstah slik. 

Pred kratkim so raziskovalci preučevali vpliv odstranjevanja nizkokakovostnih slik iz naborov podatkov za usposabljanje za izboljšanje rezultatov umetne inteligence. S filtriranjem teh nizkokakovostnih slik lahko nastali niz podatkov postane manjši, a višje kakovosti, kar vodi do boljših rezultatov brez povečanja velikosti modelov AI ali potrebe po dražji strojni opremi. Angus je povedal, da ta pristop predstavlja obetaven način za izboljšanje kakovosti slik, ustvarjenih z umetno inteligenco, ne da bi se zanašal na večje modele, ki zahtevajo več virov.

Ena od težav z umetno inteligenco v umetnosti je, da lahko razvrednoti delo človeških umetnikov, ki porabijo veliko časa za ustvarjanje umetnosti, medtem ko je umetna inteligenca sposobna ustvariti umetnost v nekaj sekundah. Vendar pa obstaja določena nematerialna kakovost človeške umetnosti, ki jo umetna inteligenca morda težko posnema, kot sta čustvena globina in kompleksnost, ki sta pogosto prisotni v delih, ki jih je ustvaril človek. NightCafe Studio verjame, da je umetna inteligenca manj namenjena ustvarjanju umetnosti v komercialne namene in bolj uživanju v samem ustvarjalnem procesu.

»Umetnost, ki jo je ustvaril človek, bo vedno imela vrednost, ker predstavlja trud in spretnost umetnika, medtem ko umetnost, ki jo ustvari umetna inteligenca, nima enake intrinzične vrednosti,«

Je rekel Angus.

Etično vprašanje v zvezi z umetno inteligenco v umetnosti je uporaba javne podobe za urjenje algoritmov umetne inteligence, ki morda ne pripadajo podjetju, ki usposablja umetno inteligenco. Čeprav trenutno ni kršenih nobenih zakonov, se postavljajo vprašanja o privolitvi in ​​zasebnosti. Odprtokodna podjetja, kot so OpenAI in DALL-E delata na tem, da bi postopek naredila bolj etičnega, vendar to ostaja odprto vprašanje. Morda bodo v prihodnosti sprejeti predpisi glede uporabe slik za urjenje AI v umetnosti.

Kljub tem pomislekom Angus verjame, da se proces umetne inteligence v umetnosti bistveno ne razlikuje od človeških umetnikov, ki črpajo navdih iz del drugih umetnikov. AI ve, kako stvari izgledajo, in si zapomni delčke slik, tako kot ljudje. Preprosto bolje jih je poustvariti iz nič.

Preberite več:

Zavrnitev odgovornosti

V skladu z Smernice projekta Trust, upoštevajte, da informacije na tej strani niso namenjene in se jih ne sme razlagati kot pravni, davčni, naložbeni, finančni ali kakršen koli drug nasvet. Pomembno je, da vlagate samo tisto, kar si lahko privoščite izgubiti, in da poiščete neodvisen finančni nasvet, če imate kakršne koli dvome. Za dodatne informacije predlagamo, da si ogledate določila in pogoje ter strani s pomočjo in podporo, ki jih nudi izdajatelj ali oglaševalec. MetaversePost se zavzema za natančno in nepristransko poročanje, vendar se tržni pogoji lahko spremenijo brez predhodnega obvestila.

O avtorju

Agne je novinarka, ki pokriva najnovejše trende in razvoj v metaverzumu, AI in Web3 industrije za Metaverse Post. Njena strast do pripovedovanja zgodb jo je pripeljala do številnih intervjujev s strokovnjaki s teh področij, pri čemer si je vedno prizadevala odkriti vznemirljive in privlačne zgodbe. Agne je diplomirala iz književnosti in ima obsežno znanje pisanja o številnih temah, vključno s potovanji, umetnostjo in kulturo. Bila je tudi prostovoljka urednica organizacije za pravice živali, kjer je pomagala ozaveščati o vprašanjih dobrega počutja živali. Kontaktirajte jo na [e-pošta zaščitena].

več člankov
Agne Cimerman
Agne Cimerman

Agne je novinarka, ki pokriva najnovejše trende in razvoj v metaverzumu, AI in Web3 industrije za Metaverse Post. Njena strast do pripovedovanja zgodb jo je pripeljala do številnih intervjujev s strokovnjaki s teh področij, pri čemer si je vedno prizadevala odkriti vznemirljive in privlačne zgodbe. Agne je diplomirala iz književnosti in ima obsežno znanje pisanja o številnih temah, vključno s potovanji, umetnostjo in kulturo. Bila je tudi prostovoljka urednica organizacije za pravice živali, kjer je pomagala ozaveščati o vprašanjih dobrega počutja živali. Kontaktirajte jo na [e-pošta zaščitena].

Institucionalni apetit raste proti Bitcoin ETF-jem sredi volatilnosti

Razkritja prek vlog 13F razkrivajo pomembne institucionalne vlagatelje, ki se ukvarjajo z Bitcoin ETF, kar poudarja vse večje sprejemanje ...

Več o tem

Prihaja dan obsodbe: usoda CZ visi na ravnovesju, ko ameriško sodišče obravnava tožbeni razlog DOJ

Changpeng Zhao se danes sooča z obsodbo na ameriškem sodišču v Seattlu.

Več o tem
Pridružite se naši inovativni tehnološki skupnosti
Preberi več
Preberi več
Injective združuje moči z AltLayer, da bi v inEVM prinesel varnost preoblikovanja
ŽELITE POSTATI PARTNER Novice Tehnologija
Injective združuje moči z AltLayer, da bi v inEVM prinesel varnost preoblikovanja
Maj 3, 2024
Masa se združuje s podjetjem Teller, da uvede MASA Lending Pool, ki omogoča izposojo USDC na osnovi
Prisotnost Novice Tehnologija
Masa se združuje s podjetjem Teller, da uvede MASA Lending Pool, ki omogoča izposojo USDC na osnovi
Maj 3, 2024
Velodrome v prihodnjih tednih lansira različico Superchain Beta in se širi po verigah blokov plasti 2 sklada OP
Prisotnost Novice Tehnologija
Velodrome v prihodnjih tednih lansira različico Superchain Beta in se širi po verigah blokov plasti 2 sklada OP
Maj 3, 2024
CARV napoveduje partnerstvo z Aethirjem za decentralizacijo njegove podatkovne plasti in razdeljevanje nagrad
ŽELITE POSTATI PARTNER Novice Tehnologija
CARV napoveduje partnerstvo z Aethirjem za decentralizacijo njegove podatkovne plasti in razdeljevanje nagrad
Maj 3, 2024
CRYPTOMERIA LABS PTE. LTD.