rozhovor Art SMW
Môže 01, 2023

DeepFloyd and Beyond: Skúmanie toho najnovšieho v umení AI s generálnym riaditeľom NightCafe Studio

Stručne

Počas exkluzívneho rozhovoru generálny riaditeľ NightCafe Studio poskytol cenné poznatky a pohľady na umenie generované AI.

Angus Russell predstavil DeepFloyd – nový algoritmus vyvinutý partnerom NightCafe Studio, Stability AI, ktorý pracuje v pixelovom priestore a na generovanie obrázkov používa model veľkého jazyka (LLM).

Štúdio NightCafe je generátor umenia AI, ktorý umožňuje používateľom vytvárať ohromujúce a futuristické umenie v priebehu niekoľkých sekúnd pomocou umelej inteligencie. Založil Angus Russell Pred štyrmi rokmi sa NightCafe Studio zrodilo z Angusovej vlastnej frustrácie z toho, že nedokázal nájsť umelecké diela, ktoré by s ním rezonovali. Poháňaný vedomím, že existujú algoritmy prenosu štýlu, hľadal webovú stránku, ktorá by mu umožnila vytvárať personalizované umenie prostredníctvom prenosu štýlu a vytlačiť ho. 

Na jeho sklamanie sa mu nepodarilo nájsť takúto platformu. Tento podraz v ňom však vyvolal inovatívny nápad. Rozhodol sa vytvoriť aplikáciu na prenos neurónového štýlu na vytváranie umenia generovaného AI a umiestnil ju na Reddit.

NightCafe Studio vzniklo ako platforma na generovanie textu na obrázok, čím sa stala prvou svojho druhu. Táto jedinečná funkcia priniesla výrazný nárast výnosov aj používateľskej základne. Odvtedy platforma zostala v popredí generatívnej AI a priťahuje veľkú komunitu nadšencov, ktorí radi používajú generátor na vytváranie ohromujúcich umeleckých diel. Dnes je NightCafe Studio všeobecne považované za jeden z najpopulárnejších a najinovatívnejších dostupných generátorov obrazu AI.

Počas rozhovoru s Angusom Russellom sme skúmali výhody a obmedzenia umenia generovaného umelou inteligenciou, rastúce využívanie umelej inteligencie v umeleckom svete a najnovší algoritmus generovania obrázkov AI, DeepFloyd.

nočné štúdio
Opera v Sydney: Jeden z Angusových prvých obrázkov vytvorených AI

Vznik umenia generovaného AI

V poslednom desaťročí bol umelecký priemysel svedkom postupnej infiltrácie AI a strojového učenia (ML). Tieto špičkové technológie zaviedli niekoľko fascinujúcich nových konceptov, ako sú Deepfakes a DALL-E, ktoré si získali významnú pozornosť po celom svete. Umelecký priemysel si dnes nemôže dovoliť ignorovať nesmierny vplyv AI, ktorý teraz spúšťa dlho očakávanú revolúciu v tomto sektore.

Angus diskutoval o tom, ako NightCafe Studio zaznamenalo skoky v raste počas vydania Stable Diffusion, model prevodu textu na obrázok, ktorý jeho spoločnosť uviedla do prevádzky v deň spustenia. Odvtedy sa bariéra vstupu na vytváranie podobných nástrojov znížila vďaka otvorenému získavaniu algoritmov a vzorových kódov.

Zakladateľ NightCafe Studio verí, že vytváranie umenia AI nie je len o konečnom produkte, ale aj o procese jeho vytvárania. Vníma to ako formu terapie a relaxu, ktorá umožňuje ľuďom prejaviť sa jedinečným a kreatívnym spôsobom. Mnoho ľudí, ktorí sa nikdy nepovažovali za kreatívnych, objavilo svoje umelecké schopnosti prostredníctvom obrázkov vytvorených AI. Táto filozofia sa odráža v používateľskom rozhraní platformy, ktoré je navrhnuté tak, aby bolo užívateľsky prívetivé a dostupné pre umelcov všetkých úrovní. 

Len v NightCafe Studio sú už dva až tri milióny používateľov mesačne, ktorí generujú približne milión obrázkov denne. Stability AI, open-source generatívna spoločnosť AI, uvedený že mali viac ako 10 miliónov používateľov, ktorí boli denne aktívni krátko po spustení Stable Diffusion.

Odporúčaná: 10+ najlepších generátorov umenia AI z roku 2023: Midjourney, DALL-E, NightCafe, Artbreeder

DeepFloyd IF: Nový algoritmus generovania obrazu AI, ktorý mení hru

NightCafe Studio implementuje nový algoritmus od Stability AI tzv DeepFloyd, ktorá sľubuje revolúciu vo vytváraní obrázkov pomocou umelej inteligencie.

DeepFloyd, ktorý je momentálne vo verzii beta, je nový model prevodu textu na obrázok, ktorý dokáže generovať pôsobivé obrázky z popisov v prirodzenom jazyku. Je založený na novej architektúre, ktorá kombinuje veľký jazykový model s tromi difúznymi modelmi. Je inšpirovaný Imagenom, podobným modelom vyvinutý spoločnosťou Google Research, ale nikdy nebol zverejnený.

Model dokáže generovať jasné a koherentné obrázky s textom a objektmi v rôznych priestorových vzťahoch, čo je náročná úloha pre väčšinu ostatných modelov text-obrázok. Dosahuje sa to použitím veľkého jazykového modelu T5-XXL-1.1 ako kódovača textu a značného množstva vrstiev krížovej pozornosti medzi textom a obrázkom, ktoré poskytujú lepšiu promptnú a obrazovú alianciu. 

DeepFloyd dokáže vytvárať aj obrázky s neštandardným pomerom strán a má vysoký stupeň fotorealizmu. Okrem toho umožňuje preklady z obrázka do obrázka s nulovým záberom, čo znamená, že štýl, vzory a detaily výstupného obrázka je možné upravovať pri zachovaní základnej podoby zdrojového obrázka bez potreby jemného dolaďovania.

Nový algoritmus funguje iným spôsobom ako Stable Diffusion. DeepFloyd využíva priestor pixelov a veľký jazykový model (LLM), zatiaľ čo Stable Diffusion využíva latentný priestor a pevný model CLIP. DeepFloyd tiež používa viacero procesov difúzie na vytváranie obrázkov Stable Diffusion používa iba jeden.

DeepFloyd je názov výskumnej skupiny, ktorá vytvorila algoritmus, a samotný algoritmus sa nazýva IF. Výskumná skupina zahŕňa veľa rovnakých ľudí, ktorí vytvorili GPT-3predchodca, GPT-2a predchádzajúci najmodernejší jazykový model s názvom RuGPT.

Niektoré špekulácie naznačujú, že názov IF môže byť inšpirovaný rovnomennou skladbou Pink Floyd, ako to naznačuje bios sociálnych médií výskumnej skupiny algoritmov.

Prečítajte si viac o algoritme tu.

nočné štúdio deepfloyd
Obrázky vytvorené pomocou DeepFloyd IF. Zdroj: Stability AI

Porovnanie obmedzení umelej inteligencie a digitálneho umenia

Jedným z hlavných obmedzení AI je text, hoci DeepFloyd tento problém rieši. Ďalším obmedzením je obtiažnosť získať obrázok presne podľa predstáv, najmä bez nabádania odborníkov. AI tiež nemá schopnosť porozumieť a interpretovať kultúrnych a sociálnych kontextov, ktoré formujú ľudské umenie. Preto umenie generované AI môže niekedy produkovať diela, ktoré sa zdajú byť nemiestne alebo kultúrne necitlivé.

Obrázky generované AI však môžu byť stále krásne a niekedy dokonca lepšie ako pôvodná myšlienka, pokiaľ je používateľ pripravený nechať sa prekvapiť, povedal Angus. Okrem toho existujú spôsoby, ako upraviť generované obrázky pomocou algoritmov AI alebo Photoshopu. Zatiaľ čo získanie presného obrazu je v súčasnosti oblasťou aktívneho výskumu, dochádza k výraznému pokroku. Čoskoro možno bude možné mať plnú kontrolu nad každým aspektom obrazu. 

AI sa ako inšpirácia spolieha na obrázky a umenie, ktoré existujú na webe, ale iba na tie, na ktorých bola trénovaná. Rôzne algoritmy, ako napr Midjourney, DALL-E a Stable Diffusion, sú trénovaní na rôznych súboroch údajov, čo znamená, že môžu dosahovať lepšie výsledky na konkrétnych typoch obrázkov. 

Nedávno výskumníci skúmali vplyv odstránenia nekvalitných obrázkov z tréningových dát na zlepšenie výsledkov AI. Odfiltrovaním týchto nekvalitných obrázkov sa môže výsledný súbor údajov zmenšiť, ale bude kvalitnejší, čo vedie k lepším výsledkom bez zväčšenia veľkosti modelov AI alebo potreby drahšieho hardvéru. Angus zdieľal, že tento prístup predstavuje sľubný spôsob, ako zlepšiť kvalitu obrázkov generovaných AI bez spoliehania sa na väčšie a na zdroje náročnejšie modely.

Jedným problémom s AI v umení je, že môže znehodnotiť prácu ľudských umelcov, ktorí trávia veľa času tvorbou umenia, zatiaľ čo AI je schopná generovať umenie v priebehu niekoľkých sekúnd. Existuje však určitá nehmotná kvalita ľudského umenia, ktorú môže byť pre AI ťažké napodobniť, ako je napríklad emocionálna hĺbka a zložitosť často prítomná v dielach vytvorených ľuďmi. NightCafe Studio verí, že AI je menej o vytváraní umenia na komerčné účely a viac o pôžitku zo samotného tvorivého procesu.

„Vždy bude mať umenie vytvorené človekom hodnotu, pretože predstavuje úsilie a zručnosť umelca, zatiaľ čo umenie generované AI nemá rovnakú vnútornú hodnotu,“

Povedal Angus.

Etickým problémom súvisiacim s AI v umení je používanie verejného obrazu na trénovanie algoritmov AI, ktoré nemusia patriť spoločnosti, ktorá AI školí. Aj keď v súčasnosti nie sú porušené žiadne zákony, vyvoláva to otázky týkajúce sa súhlasu a súkromia. Open-source spoločnosti ako OpenAI a DALL-E pracujú na tom, aby bol tento proces etickejší, ale zostáva to otvorenou otázkou. V budúcnosti môžu existovať nariadenia týkajúce sa používania obrázkov na trénovanie AI v umení.

Napriek týmto obavám Angus verí, že proces AI v umení sa zásadne nelíši od ľudských umelcov, ktorí čerpajú inšpiráciu z práce iných umelcov. Umelá inteligencia vie, ako veci vyzerajú, a pamätá si kúsky obrázkov, rovnako ako ľudia. Jednoducho je lepšie ich vytvoriť od začiatku.

Prečítajte si viac:

Vylúčenie zodpovednosti

V súlade s Pokyny k projektu Trust, uvedomte si, že informácie uvedené na tejto stránke nie sú zamýšľané a nemali by byť interpretované ako právne, daňové, investičné, finančné alebo iné formy poradenstva. Je dôležité investovať len toľko, koľko si môžete dovoliť stratiť a v prípade akýchkoľvek pochybností vyhľadať nezávislé finančné poradenstvo. Ak chcete získať ďalšie informácie, odporúčame vám pozrieť si zmluvné podmienky, ako aj stránky pomoci a podpory poskytnuté vydavateľom alebo inzerentom. MetaversePost sa zaviazala poskytovať presné a nezaujaté správy, ale podmienky na trhu sa môžu zmeniť bez upozornenia.

O autorovi

Agne je novinárka, ktorá pokrýva najnovšie trendy a vývoj v oblasti metaverse, AI a Web3 priemyslu pre Metaverse Post. Jej vášeň pre rozprávanie ju priviedla k mnohým rozhovorom s odborníkmi v týchto oblastiach, pričom sa vždy snažila odhaliť vzrušujúce a pútavé príbehy. Agne má bakalársky titul v odbore literatúra a má rozsiahle skúsenosti s písaním o širokej škále tém vrátane cestovania, umenia a kultúry. Dobrovoľne pracovala aj ako redaktorka organizácie za práva zvierat, kde pomáhala zvyšovať povedomie o otázkach dobrých životných podmienok zvierat. Kontaktujte ju [chránené e-mailom].

Ďalšie články
Agne Cimermanová
Agne Cimermanová

Agne je novinárka, ktorá pokrýva najnovšie trendy a vývoj v oblasti metaverse, AI a Web3 priemyslu pre Metaverse Post. Jej vášeň pre rozprávanie ju priviedla k mnohým rozhovorom s odborníkmi v týchto oblastiach, pričom sa vždy snažila odhaliť vzrušujúce a pútavé príbehy. Agne má bakalársky titul v odbore literatúra a má rozsiahle skúsenosti s písaním o širokej škále tém vrátane cestovania, umenia a kultúry. Dobrovoľne pracovala aj ako redaktorka organizácie za práva zvierat, kde pomáhala zvyšovať povedomie o otázkach dobrých životných podmienok zvierat. Kontaktujte ju [chránené e-mailom].

Inštitucionálny apetít rastie smerom k bitcoinovým ETF uprostred volatility

Zverejnenia prostredníctvom podaní 13F odhaľujú pozoruhodných inštitucionálnych investorov, ktorí sa venujú bitcoinovým ETF, čo podčiarkuje rastúcu akceptáciu ...

vedieť viac

Prichádza deň odsúdenia: Osud CZ visí v rovnováhe, pretože americký súd zvažuje žalobu ministerstva spravodlivosti

Changpeng Zhao dnes čaká na americkom súde v Seattli odsúdenie.

vedieť viac
Pripojte sa k našej komunite inovatívnych technológií
Čítaj viac
Čítaj viac
Injective spája svoje sily s AltLayer, aby priniesla bezpečnosť pri prestavbe inEVM
firmy Novinová správa Technológia
Injective spája svoje sily s AltLayer, aby priniesla bezpečnosť pri prestavbe inEVM
Môže 3, 2024
Masa sa spojila so spoločnosťou Teller, aby predstavila fond pôžičiek MASA a umožnila požičiavanie USDC na základni
trhy Novinová správa Technológia
Masa sa spojila so spoločnosťou Teller, aby predstavila fond pôžičiek MASA a umožnila požičiavanie USDC na základni
Môže 3, 2024
Velodrome uvádza na trh beta verziu Superchain v najbližších týždňoch a rozširuje sa o blockchainy OP Stack Layer 2
trhy Novinová správa Technológia
Velodrome uvádza na trh beta verziu Superchain v najbližších týždňoch a rozširuje sa o blockchainy OP Stack Layer 2
Môže 3, 2024
CARV oznamuje partnerstvo so spoločnosťou Aethir s cieľom decentralizovať svoju dátovú vrstvu a distribuovať odmeny
firmy Novinová správa Technológia
CARV oznamuje partnerstvo so spoločnosťou Aethir s cieľom decentralizovať svoju dátovú vrstvu a distribuovať odmeny
Môže 3, 2024
CRYPTOMERIA LABS PTE. LTD.