Võib 01 2023

DeepFloyd and Beyond: uurige tehisintellekti kunsti uusimaid asju koos NightCafe Studio tegevjuhiga

Avaldatud: 01. mai 2023 kell 7:00 Värskendatud: 02. juuni 2023 kell 2:49

Muudetud ja faktide alusel kontrollitud: 01. mai 2023 kell 7:00

Põgusalt

Eksklusiivse intervjuu ajal andis NightCafe Studio tegevjuht väärtuslikke teadmisi ja vaatenurki tehisintellekti loodud kunsti kohta.

Angus Russell tutvustas DeepFloydi – uut algoritmi, mille töötas välja NightCafe Studio partner, Stability AI, mis töötab piksliruumis ja kasutab piltide genereerimiseks suurt keelemudelit (LLM).

NightCafe stuudio on AI Art Generator, mis võimaldab kasutajatel tehisintellekti abil luua mõne sekundiga vapustavat ja futuristlikku kunsti. Asutaja Angus Russell neli aastat tagasi sündis NightCafe Studio Anguse enda pettumusest, kuna ta ei suutnud leida kunstiteoseid, mis talle vastukaja tekitasid. Ajendatuna teadmisest, et stiiliedastusalgoritmid on olemas, otsis ta veebisaiti, mis võimaldaks tal stiilisiirde abil luua isikupärastatud kunsti ja seda printida.

Tema pettumuseks ei leidnud ta sellist platvormi. See tagasilöök tekitas temas aga uuendusliku idee. Ta otsustas luua AI-ga loodud kunsti loomiseks närvistiili ülekanderakenduse ja pani selle Redditi üles.

NightCafe Studio sai alguse tekstist pildiks genereeriva platvormina, mis teeb sellest esimese omataolise. See ainulaadne funktsioon tõi kaasa nii tulude kui ka kasutajabaasi märkimisväärse tõusu. Sellest ajast peale on platvorm püsinud generatiivse AI esirinnas, meelitades ligi suurt kogukonda entusiaste, kes tunnevad rõõmu generaatori kasutamisest vapustavate kunstiteoste loomiseks. Tänapäeval peetakse NightCafe Studiot laialdaselt üheks populaarseimaks ja uuenduslikumaks saadaolevaks AI pildigeneraatoriks.

Angus Russelliga antud intervjuus uurisime tehisintellekti kasvavat kasutust kunstimaailmas ja tehisintellekti uusimat algoritmi DeepFloyd, mis on AI-ga loodud kunsti eelised ja piirangud.

öökohviku stuudio — Sydney ooperimaja: üks Anguse esimesi tehisintellektiga loodud pilte

AI-ga loodud kunsti tekkimine

Viimase kümnendi jooksul on kunstitööstus olnud tunnistajaks tehisintellekti ja masinõppe (ML) järkjärgulisele imbumisele. Need tipptasemel tehnoloogiad on kasutusele võtnud mõned põnevad uued kontseptsioonid, nagu Deepfakes ja DALL-E, mis on pälvinud märkimisväärset tähelepanu kogu maailmas. Tänapäeval ei saa kunstitööstus endale lubada ignoreerida tehisintellekti tohutut mõju, mis käivitab nüüd sektoris kauaoodatud revolutsiooni.

Angus arutles, kuidas NightCafe Studio koges äsja ilmumise ajal kasvu Stable Diffusion, tekstist pildiks muutev mudel, mida tema ettevõte käivitas turuletoomise päeval. Sellest ajast alates on sarnaste tööriistade loomise barjäär algoritmide ja näidiskoodide avatud lähtekoodi tõttu alandatud.

NightCafe Studio asutaja usub, et tehisintellekti kunsti loomine ei seisne ainult lõpptootes, vaid ka selle loomise protsessis. Ta näeb seda teraapia- ja lõõgastusvormina, mis võimaldab inimestel end ainulaadsel ja loomingulisel viisil väljendada. Paljud inimesed, kes polnud end kunagi loovaks pidanud, on oma kunstilised võimed avastanud tehisintellektiga loodud piltide kaudu. See filosoofia kajastub platvormi kasutajaliideses, mis on loodud kasutajasõbralikuks ja kõigile oskustasemetele ligipääsetavaks.

Ainuüksi NightCafe Studios on juba kaks kuni kolm miljonit kasutajat kuus, kes loovad umbes miljon pilti päevas. Stability AI, avatud lähtekoodiga generatiivne AI ettevõte, väljendatud et neil oli üle 10 miljoni kasutaja, kes olid igapäevaselt aktiivsed vahetult pärast rakenduse käivitamist Stable Diffusion.

Soovitan: 10. aasta 2023+ parimat AI kunstigeneraatorit: Midjourney, DALL-E, NightCafe, Artbreeder

DeepFloyd IF: uus mänge muutev tehisintellekti kujutise genereerimise algoritm

NightCafe Studio juurutab uut algoritmi Stability AI kutsutud DeepFloyd, mis tõotab muuta tehisintellektiga piltide genereerimise viisi.

DeepFloyd, mis on praegu beetaversioonis, on uus tekstist pildiks muutev mudel, mis suudab luua muljetavaldavaid pilte loomuliku keele kirjeldustest. See põhineb uudsel arhitektuuril, mis ühendab suure keelemudeli kolme difusioonimudeliga. See on inspireeritud Imagenist, sarnasest mudelist, mille on välja töötanud Google Research, kuid mida pole kunagi avalikkusele avaldatud.

Mudel suudab luua selgeid ja sidusaid pilte teksti ja erinevates ruumisuhetes olevate objektidega, mis on enamiku teiste tekstist pildiks mudelite jaoks keeruline ülesanne. See saavutatakse, kasutades teksti kodeerijana suurt keelemudelit T5-XXL-1.1 ja märkimisväärsel hulgal teksti-pildi risttähelepanu kihte, mis tagavad parema viipe ja pildi ühenduse.

DeepFloyd saab luua ka mittestandardse kuvasuhtega pilte ja sellel on kõrge fotorealism. Lisaks võimaldab see nullkaadri tõlkeid pildist pildiks, mis tähendab, et väljundpildi stiili, mustreid ja detaile saab muuta, säilitades samal ajal lähtepildi põhivormi, ilma et oleks vaja peenhäälestust.

Uus algoritm töötab teistmoodi kui Stable Diffusion. DeepFloyd kasutab piksliruumi ja suure keele mudelit (LLM), kusjuures Stable Diffusion kasutab varjatud ruumi ja fikseeritud CLIP-mudelit. DeepFloyd kasutab piltide loomiseks ka mitut difusiooniprotsessi Stable Diffusion kasutab ainult ühte.

DeepFloyd on algoritmi koostanud uurimisrühma nimi ja algoritmi ennast nimetatakse IF-iks. Uurimisrühma kuulub palju samu inimesi, kes lõid GPT-3eelkäija, GPT-2, ja eelmine tipptasemel keelemudel nimega RuGPT.

Mõned spekulatsioonid viitavad sellele, et nimi IF võib olla inspireeritud Pink Floydi samanimelisest laulust, nagu vihjab algoritmide uurimisrühma sotsiaalmeedia bios.

Lisateavet algoritmi kohta siin.

deepfloydi öökohviku stuudio — DeepFloyd IF-iga loodud pildid. Allikas: Stability AI

AI kunstipiirangute ja digitaalse kunsti võrdlemine

Üks peamisi AI piiranguid on tekst, kuigi DeepFloyd tegeleb selle probleemiga. Teiseks piiranguks on raskused saada täpselt ette nähtud kujutist, eriti ilma asjatundja juhisteta. AI-l puudub ka võime seda mõista ja tõlgendada inimkunsti kujundavad kultuurilised ja sotsiaalsed kontekstid. Seetõttu võib tehisintellekti loodud kunst mõnikord toota teoseid, mis tunduvad kohatud või kultuuriliselt tundetud.

AI-ga loodud pildid võivad siiski olla ilusad ja kohati isegi paremad kui algne idee, kui kasutaja on valmis üllatuma, ütles Angus. Lisaks on võimalusi selle muutmiseks loodud pilte AI algoritmide või Photoshopi abil. Kuigi täpse pildi saamine on praegu aktiivse uurimistöö valdkond, tehakse märkimisväärseid edusamme. Varsti võib olla võimalik omada täielikku kontrolli pildi kõigi aspektide üle.

Tehisintellekt tugineb inspiratsioonina veebis eksisteerivatele piltidele ja kunstile, kuid ainult neile, mille järgi see on koolitatud. Erinevad algoritmid, nt Midjourney, DALL-E ja Stable Diffusion, on õpetatud kasutama erinevaid andmekogumeid, mis tähendab, et need võivad teatud tüüpi kujutiste puhul paremini toimida.

Hiljuti on teadlased uurinud madala kvaliteediga piltide eemaldamise mõju koolitusandmete kogumitest, et parandada tehisintellekti tulemusi. Nende madala kvaliteediga piltide välja filtreerimisel võib saadav andmekogum muutuda väiksemaks, kuid kvaliteetsemaks, mis annab paremaid tulemusi ilma tehisintellekti mudelite suurust suurendamata või kallimat riistvara nõudmata. Angus jagas, et see lähenemisviis on paljutõotav viis AI-ga loodud piltide kvaliteedi parandamiseks ilma suurematele ja ressursimahukamatele mudelitele tuginemata.

Üks AI probleem kunstis on see, et see võib devalveerida inimkunstnike tööd, kes kulutavad kunsti loomisele palju aega, samas kui AI suudab kunsti luua mõne sekundiga. Siiski on inimkunstil teatud immateriaalne kvaliteet, mida tehisintellektil võib olla raske korrata, näiteks inimese loodud teostes sageli esinev emotsionaalne sügavus ja keerukus. NightCafe Studio usub, et tehisintellekt on vähem seotud ärilistel eesmärkidel kunsti loomisega, vaid rohkem loomeprotsessi enda nautimisega.

"Inimeste loodud kunstil on alati väärtus, kuna see esindab kunstniku pingutusi ja oskusi, samas kui tehisintellekti loodud kunstil pole sama väärtust."
Ütles Angus.

Kunsti tehisintellektiga seotud eetiline probleem on avaliku pildi kasutamine AI-algoritmide koolitamiseks, mis ei pruugi kuuluda tehisintellekti koolitavale ettevõttele. Kuigi praegu pole ühtegi seadust rikutud, tekitab see küsimusi nõusoleku ja privaatsuse kohta. Avatud lähtekoodiga ettevõtetele meeldib OpenAI ja DALL-E töötavad selle nimel, et muuta protsess eetilisemaks, kuid see jääb lahtiseks küsimuseks. Tulevikus võivad kehtida eeskirjad piltide kasutamise kohta tehisintellekti kunstis treenimiseks.

Nendest muredest hoolimata usub Angus, et AI protsess kunstis ei erine põhimõtteliselt inimestest, kes ammutavad inspiratsiooni teiste kunstnike töödest. AI teab, kuidas asjad välja näevad, ja jätab piltidest tükid meelde nagu inimesed. Neid on lihtsalt parem nullist uuesti luua.

Loe rohkem:

Sildid:

Kaebused

Vastavalt Usaldusprojekti juhised, pange tähele, et sellel lehel esitatud teave ei ole mõeldud ega tohiks tõlgendada kui juriidilist, maksu-, investeerimis-, finants- või muud nõuannet. Oluline on investeerida ainult seda, mida saate endale lubada kaotada, ja kahtluste korral küsida sõltumatut finantsnõu. Lisateabe saamiseks soovitame vaadata nõudeid ja tingimusi ning väljaandja või reklaamija pakutavaid abi- ja tugilehti. MetaversePost on pühendunud täpsele ja erapooletule aruandlusele, kuid turutingimusi võidakse ette teatamata muuta.

Umbes Autor

Agne on ajakirjanik, kes kajastab uusimaid trende ja arenguid metaversumis, AI-s ja Web3 tööstused Metaverse Post. Tema kirg lugude jutustamise vastu on viinud ta andma arvukalt intervjuusid nende valdkondade ekspertidega, püüdes alati avastada põnevaid ja kaasahaaravaid lugusid. Agnel on bakalaureusekraad kirjanduses ja tal on laialdane taust kirjutamisel väga erinevatel teemadel, sealhulgas reisimine, kunst ja kultuur. Ta on olnud ka vabatahtlik toimetaja loomaõiguste organisatsioonis, kus ta aitas tõsta teadlikkust loomade heaolu küsimustest. Võtke temaga ühendust [meiliga kaitstud].

Veel artikleid

Agne Cimerman