Haastatella Art SMW
Voi 01, 2023

DeepFloyd and Beyond: Tutustu tekoälytaiteen viimeisimpiin tapahtumiin NightCafe Studion toimitusjohtajan kanssa

Lyhyesti

Ylellisen haastattelun aikana NightCafe Studion toimitusjohtaja tarjosi arvokkaita oivalluksia ja näkökulmia tekoälyn tuottamaan taiteeseen.

Angus Russell esitteli DeepFloydin – NightCafe Studion yhteistyökumppanin kehittämän uuden algoritmin. Stability AI, joka toimii pikselitilassa ja käyttää Large Language Model (LLM) -mallia kuvien luomiseen.

NightCafe Studio on AI Art Generator, jonka avulla käyttäjät voivat luoda upeaa ja futuristista taidetta sekunneissa tekoälyn avulla. Perustanut Angus Russell neljä vuotta sitten NightCafe Studio syntyi Angusin omasta turhautumisesta, koska hän ei löytänyt taideteoksia, jotka resonoivat hänen kanssaan. Tyylinsiirtoalgoritmien olemassaolon tiedostamana hän etsi verkkosivustoa, jonka avulla hän voisi luoda yksilöllistä taidetta tyylisiirron avulla ja tulostaa sen. 

Pettymykseksi hän ei löytänyt sellaista alustaa. Tämä takaisku herätti hänessä kuitenkin innovatiivisen idean. Hän päätti luoda hermotyylien siirtosovelluksen tekoälyn luoman taiteen luomiseen, ja hän laittoi sen Redditiin.

NightCafe Studio syntyi tekstistä kuvaksi -generointialustaksi, mikä teki siitä ensimmäisen laatuaan. Tämä ainutlaatuinen ominaisuus kasvatti merkittävästi sekä tuloja että käyttäjäkuntaa. Siitä lähtien alusta on pysynyt generatiivisen tekoälyn eturintamassa, ja se houkuttelee suuren yhteisön harrastajia, jotka nauttivat generaattorin käyttämisestä upeiden taideteosten luomiseen. Nykyään NightCafe Studiota pidetään laajalti yhtenä suosituimmista ja innovatiivisimmista saatavilla olevista tekoälykuvageneraattoreista.

Angus Russellin haastattelussa tutkimme tekoälyn tuottaman taiteen etuja ja rajoituksia, tekoälyn lisääntyvää käyttöä taidemaailmassa ja viimeisintä tekoälykuvan generointialgoritmia, DeepFloydia.

yökahvilan studio
Sydneyn oopperatalo: Yksi Angusin ensimmäisistä tekoälyllä luomista kuvista

Tekoälyn luoman taiteen syntyminen

Viimeisen vuosikymmenen aikana taideteollisuus on todistanut tekoälyn ja koneoppimisen (ML) asteittaista soluttautumista. Nämä huipputeknologiat ovat ottaneet käyttöön kiehtovia uusia konsepteja, kuten Deepfakes ja DALL-E, jotka ovat saaneet merkittävää huomiota ympäri maailmaa. Nykyään taideteollisuudella ei ole varaa sivuuttaa tekoälyn valtavaa vaikutusta, joka nyt käynnistää alalla kauan odotetun vallankumouksen.

Angus keskusteli siitä, kuinka NightCafe Studio koki kasvupiikit julkaisun aikana Stable Diffusion, tekstistä kuvaksi -malli, jonka hänen yrityksensä otti käyttöön julkaisupäivänä. Sittemmin markkinoille pääsyn esteitä vastaavien työkalujen luomiselle on alennettu algoritmien ja esimerkkikoodien avoimen lähdekoodin ansiosta.

NightCafe Studion perustaja uskoo, että tekoälytaiteen luomisessa ei ole kyse vain lopputuotteesta vaan myös sen luomisprosessista. Hän näkee sen eräänlaisena terapian ja rentoutumisen muotona, jonka avulla ihmiset voivat ilmaista itseään ainutlaatuisilla ja luovilla tavoilla. Monet ihmiset, jotka eivät olleet koskaan pitäneet itseään luovina, ovat löytäneet taiteelliset kykynsä tekoälyn luomien kuvien avulla. Tämä filosofia heijastuu alustan käyttöliittymässä, joka on suunniteltu käyttäjäystävälliseksi ja kaikkien tasoisten taiteilijoiden ulottuville. 

Pelkästään NightCafe Studiossa on jo kahdesta kolmeen miljoonaa käyttäjää kuukaudessa, mikä tuottaa noin miljoona kuvaa päivässä. Stability AI, avoimen lähdekoodin luova tekoälyyritys, totesi että heillä oli yli 10 miljoonaa käyttäjää, jotka olivat aktiivisia päivittäin pian julkaisun jälkeen Stable Diffusion.

Suositus: Yli 10 parasta tekoälytaidegeneraattoria vuonna 2023: Midjourney, DALL-E, NightCafe, Artbreeder

DeepFloyd IF: Uusi peliä muuttava tekoälykuvan generointialgoritmi

NightCafe Studio ottaa käyttöön uuden algoritmin Stability AI nimeltään DeepFloyd, joka lupaa mullistaa tavan, jolla luomme kuvia tekoälyllä.

Tällä hetkellä betavaiheessa oleva DeepFloyd on uusi tekstistä kuvaksi -malli, joka voi luoda vaikuttavia kuvia luonnollisen kielen kuvauksista. Se perustuu uuteen arkkitehtuuriin, joka yhdistää suuren kielimallin kolmeen diffuusiomalliin. Se on saanut inspiraationsa Imagenistä, samankaltaisesta mallista, jonka Google Research on kehittänyt, mutta jota ei koskaan julkaistu yleisölle.

Malli pystyy luomaan selkeitä ja yhtenäisiä kuvia tekstin ja objektien kanssa erilaisissa tilasuhteissa, mikä on haastava tehtävä useimmille muille tekstistä kuvaksi -malleille. Tämä saavutetaan käyttämällä suurta kielimallia T5-XXL-1.1 tekstikooderina ja huomattavaa määrää teksti-kuvan ristiin huomioivia kerroksia, jotka tarjoavat paremman viitteen ja kuvaliiton. 

DeepFloyd voi myös luoda kuvia, joiden kuvasuhde on poikkeava ja jolla on korkea fotorealismi. Lisäksi se mahdollistaa nollakuvan käännökset kuvasta kuvaksi, mikä tarkoittaa, että tulostuskuvan tyyliä, kuvioita ja yksityiskohtia voidaan muokata säilyttäen samalla lähdekuvan perusmuoto ilman hienosäätöä.

Uusi algoritmi toimii eri tavalla kuin Stable Diffusion. DeepFloyd käyttää pikselitilaa ja Large Language Model (LLM) -mallia, kun taas Stable Diffusion käyttää piilevää tilaa ja kiinteää CLIP-mallia. DeepFloyd käyttää myös useita diffuusioprosesseja kuvien luomiseen Stable Diffusion käyttää vain yhtä.

DeepFloyd on algoritmin rakentaneen tutkimusryhmän nimi, ja itse algoritmia kutsutaan nimellä IF. Tutkimusryhmään kuuluu monia samoja ihmisiä, jotka loivat GPT-3edeltäjä, GPT-2, ja aikaisempi huippuluokan kielimalli nimeltä RuGPT.

Jotkut spekulaatiot viittaavat siihen, että nimi IF voi olla inspiraationa samannimisestä Pink Floyd -kappaleesta, kuten algoritmitutkimusryhmän sosiaalisen median biosissa vihjataan.

Lue lisää algoritmista tätä.

deepfloyd yökahvilastudio
DeepFloyd IF:llä luodut kuvat. Lähde: Stability AI

Tekoälytaiteen rajoitusten ja digitaalisen taiteen vertailu

Yksi suurimmista tekoälyn rajoituksista on teksti, vaikka DeepFloyd käsittelee tätä ongelmaa. Toinen rajoitus on vaikeus saada juuri sellainen kuva kuin kuviteltiin, varsinkin ilman asiantuntijan kehotusta. Tekoälyllä ei myöskään ole kykyä ymmärtää ja tulkita kulttuuriset ja sosiaaliset kontekstit, jotka muokkaavat ihmisen taidetta. Siksi tekoälyn tuottama taide voi toisinaan tuottaa teoksia, jotka näyttävät sopimattomilta tai kulttuurisesti epäherkiltä.

Tekoälyn luomat kuvat voivat kuitenkin olla kauniita ja toisinaan jopa parempia kuin alkuperäinen idea, kunhan käyttäjä on valmis yllättymään, Angus sanoi. Lisäksi on olemassa tapoja muokata luotuja kuvia tekoälyalgoritmeilla tai Photoshopilla. Tarkan kuvan saaminen on tällä hetkellä aktiivisen tutkimuksen alaa, mutta merkittävää edistystä tapahtuu. Pian voi olla mahdollista hallita täysin kuvan kaikkia puolia. 

AI luottaa inspiraationa verkossa oleviin kuviin ja taiteeseen, mutta vain niihin, joihin se on koulutettu. Erilaisia ​​algoritmeja, esim Midjourney, DALL-E ja Stable Diffusion, ovat koulutettuja käyttämään erilaisia ​​tietojoukkoja, mikä tarkoittaa, että ne voivat toimia paremmin tietyntyyppisissä kuvissa. 

Viime aikoina tutkijat ovat tutkineet huonolaatuisten kuvien poistamisen vaikutusta harjoitustietosarjoista tekoälytulosten parantamiseksi. Suodattamalla nämä huonolaatuiset kuvat pois, tuloksena olevasta datajoukosta voi tulla pienempi, mutta laadukkaampi, mikä johtaa parempiin tuloksiin ilman tekoälymallien koon kasvattamista tai kalliimpaa laitteistoa. Angus kertoi, että tämä lähestymistapa on lupaava tapa parantaa tekoälyn luomien kuvien laatua luottamatta suurempiin ja resurssiintensiivisimpiin malleihin.

Yksi ongelma taiteen tekoälyssä on se, että se voi devalvoida ihmistaiteilijoiden työtä, koska he viettävät paljon aikaa taiteen luomiseen, kun taas tekoäly pystyy luomaan taidetta muutamassa sekunnissa. Ihmistaiteessa on kuitenkin tietty aineeton laatu, jota tekoälyn voi olla vaikea toistaa, kuten ihmisten luomissa teoksissa usein esiintyvä emotionaalinen syvyys ja monimutkaisuus. NightCafe Studio uskoo, että tekoäly tarkoittaa vähemmän taiteen luomista kaupallisiin tarkoituksiin, vaan enemmän itse luovan prosessin nauttimiseen.

"Ihmisen tekemällä taiteella on aina arvoa, koska se edustaa taiteilijan työtä ja taitoa, kun taas tekoälyn luomalla taiteella ei ole samaa luontaista arvoa."

Angus sanoi.

Tekoälyyn liittyvä eettinen ongelma taiteessa on julkisten kuvien käyttö sellaisten tekoälyalgoritmien kouluttamiseen, jotka eivät välttämättä kuulu tekoälyä kouluttavalle yritykselle. Vaikka tällä hetkellä ei ole rikottu lakeja, se herättää kysymyksiä suostumuksesta ja yksityisyydestä. Avoimen lähdekoodin yritykset pitävät OpenAI ja DALL-E pyrkivät tekemään prosessista eettisemmän, mutta se on edelleen avoin kysymys. Tulevaisuudessa saattaa olla säännöksiä kuvien käytöstä AI-koulutuksessa.

Näistä huolenaiheista huolimatta Angus uskoo, että tekoälyprosessi taiteessa ei pohjimmiltaan eroa ihmistaiteilijoista, jotka saavat inspiraatiota muiden taiteilijoiden töistä. Tekoäly tietää, miltä asiat näyttävät, ja muistaa kuvia kuvista, aivan kuten ihmisetkin. Se on yksinkertaisesti parempi luoda ne uudelleen tyhjästä.

Lue lisää:

Vastuun kieltäminen

Mukaisesti Luottamusprojektin ohjeetHuomaa, että tällä sivulla annettuja tietoja ei ole tarkoitettu eikä niitä tule tulkita oikeudellisiksi, verotukselliseksi, sijoitus-, rahoitus- tai minkään muun muodon neuvoiksi. On tärkeää sijoittaa vain sen verran, mitä sinulla on varaa menettää, ja pyytää riippumatonta talousneuvontaa, jos sinulla on epäilyksiä. Lisätietoja saat käyttöehdoista sekä myöntäjän tai mainostajan tarjoamista ohje- ja tukisivuista. MetaversePost on sitoutunut tarkkaan, puolueettomaan raportointiin, mutta markkinaolosuhteet voivat muuttua ilman erillistä ilmoitusta.

Author

Agne on toimittaja, joka käsittelee metaversumien, tekoälyn ja uusimpia trendejä ja kehitystä Web3 toimialoja varten Metaverse Post. Hänen intohimonsa tarinankerrontaan on johtanut hänen haastatteluihinsa näiden alojen asiantuntijoiden kanssa pyrkien aina löytämään jännittäviä ja mukaansatempaavia tarinoita. Agnella on kandidaatin tutkinto kirjallisuudesta ja laaja tausta kirjoittamiseen monenlaisista aiheista, kuten matkailusta, taiteesta ja kulttuurista. Hän on myös toiminut vapaaehtoisena toimittajana eläinoikeusjärjestöön, jossa hän auttoi lisäämään tietoisuutta eläinten hyvinvointikysymyksistä. Ota häneen yhteyttä [sähköposti suojattu].

lisää artikkeleita
Agne Cimerman
Agne Cimerman

Agne on toimittaja, joka käsittelee metaversumien, tekoälyn ja uusimpia trendejä ja kehitystä Web3 toimialoja varten Metaverse Post. Hänen intohimonsa tarinankerrontaan on johtanut hänen haastatteluihinsa näiden alojen asiantuntijoiden kanssa pyrkien aina löytämään jännittäviä ja mukaansatempaavia tarinoita. Agnella on kandidaatin tutkinto kirjallisuudesta ja laaja tausta kirjoittamiseen monenlaisista aiheista, kuten matkailusta, taiteesta ja kulttuurista. Hän on myös toiminut vapaaehtoisena toimittajana eläinoikeusjärjestöön, jossa hän auttoi lisäämään tietoisuutta eläinten hyvinvointikysymyksistä. Ota häneen yhteyttä [sähköposti suojattu].

Institutionaalinen ruokahalu kasvaa kohti Bitcoin ETF:iä volatiliteetin keskellä

13F-hakemusten kautta tehdyt ilmoitukset paljastavat merkittäviä institutionaalisia sijoittajia, jotka harrastavat Bitcoinin ETF:itä, mikä korostaa kasvavaa hyväksyntää ...

Tiedä enemmän

Tuomiopäivä saapuu: CZ:n kohtalo on tasapainossa, kun Yhdysvaltain tuomioistuin harkitsee DOJ:n vetoomusta

Changpeng Zhao odottaa tänään tuomiota Yhdysvaltain oikeudessa Seattlessa.

Tiedä enemmän
Liity innovatiiviseen teknologiayhteisöömme
Lue lisää
Lue lisää
Injective yhdistää voimansa AltLayerin kanssa tuodakseen Restakingin turvallisuuden inEVM:ään
Bisnes Uutisraportti Elektroniikka
Injective yhdistää voimansa AltLayerin kanssa tuodakseen Restakingin turvallisuuden inEVM:ään
Voi 3, 2024
Masa tekee yhteistyötä Tellerin kanssa ottaakseen käyttöön MASA-lainauspoolin, mikä mahdollistaa USDC-lainauksen pohjalta
markkinat Uutisraportti Elektroniikka
Masa tekee yhteistyötä Tellerin kanssa ottaakseen käyttöön MASA-lainauspoolin, mikä mahdollistaa USDC-lainauksen pohjalta
Voi 3, 2024
Velodrome julkaisee Superchain Beta -version tulevina viikkoina ja laajenee OP Stack Layer 2 -lohkoketjuihin
markkinat Uutisraportti Elektroniikka
Velodrome julkaisee Superchain Beta -version tulevina viikkoina ja laajenee OP Stack Layer 2 -lohkoketjuihin
Voi 3, 2024
CARV ilmoittaa yhteistyöstä Aethirin kanssa tietokerroksen hajauttamiseksi ja palkintojen jakamiseksi
Bisnes Uutisraportti Elektroniikka
CARV ilmoittaa yhteistyöstä Aethirin kanssa tietokerroksen hajauttamiseksi ja palkintojen jakamiseksi
Voi 3, 2024
CRYPTOMERIA LABS PTE. OY.