Rozhovor Umění SMW
01

DeepFloyd and Beyond: Zkoumání toho nejnovějšího v umění AI s CEO NightCafe Studio

Stručně

Během exkluzivního rozhovoru poskytl generální ředitel NightCafe Studio cenné poznatky a pohledy na umění generované AI.

Angus Russell představil DeepFloyd – nový algoritmus vyvinutý partnerem NightCafe Studio, Stability AI, který pracuje v pixelovém prostoru a ke generování obrázků používá velký jazykový model (LLM).

Studio NightCafe je AI Art Generator, který umožňuje uživatelům vytvářet ohromující a futuristické umění během několika sekund s pomocí umělé inteligence. Založeno Angus Russell před čtyřmi lety se NightCafe Studio zrodilo z Angusovy vlastní frustrace z toho, že nebyl schopen najít umělecká díla, která by s ním rezonovala. Poháněn vědomím, že existují algoritmy přenosu stylů, hledal webovou stránku, která by mu umožnila vytvářet personalizované umění prostřednictvím přenosu stylu a tisknout je. 

Ke svému zklamání nemohl takovou platformu najít. Tento neúspěch v něm však vyvolal inovativní nápad. Rozhodl se vytvořit aplikaci pro přenos neurálního stylu pro vytváření umění generovaného umělou inteligencí a umístil ji na Reddit.

NightCafe Studio vzniklo jako platforma pro generování textu na obrázek, díky čemuž je první svého druhu. Tato jedinečná funkce přinesla výrazný nárůst jak tržeb, tak uživatelské základny. Od té doby zůstala tato platforma v popředí generativní umělé inteligence a přilákala velkou komunitu nadšenců, kteří rádi používají generátor k vytváření ohromujících uměleckých děl. Dnes je NightCafe Studio široce považováno za jeden z nejpopulárnějších a nejinovativnějších dostupných generátorů obrazu AI.

Během rozhovoru s Angusem Russellem jsme prozkoumali výhody a omezení umění generovaného umělou inteligencí, rostoucí využití umělé inteligence v uměleckém světě a nejnovější algoritmus generování obrázků AI, DeepFloyd.

studio noční kavárny
Opera v Sydney: Jeden z prvních Angusových obrázků generovaných umělou inteligencí

Vznik umění generovaného umělou inteligencí

V posledním desetiletí byl umělecký průmysl svědkem postupné infiltrace AI a strojového učení (ML). Tyto špičkové technologie zavedly některé fascinující nové koncepty, jako jsou Deepfakes a DALL-E, které si získaly významnou pozornost po celém světě. Umělecký průmysl si dnes nemůže dovolit ignorovat nesmírný dopad umělé inteligence, která nyní v tomto odvětví spouští dávno očekávanou revoluci.

Angus diskutoval o tom, jak NightCafe Studio zaznamenalo skoky v růstu během vydání Stable Diffusion, model převodu textu na obrázek, se kterým jeho společnost uvedla na trh v den uvedení. Od té doby byla překážka vstupu pro vytváření podobných nástrojů snížena díky otevřenému získávání algoritmů a vzorových kódů.

Zakladatel NightCafe Studio věří, že vytváření umění AI není jen o konečném produktu, ale také o procesu jeho vytváření. Vidí to jako formu terapie a relaxace, která umožňuje lidem vyjádřit se jedinečným a kreativním způsobem. Mnoho lidí, kteří se nikdy nepovažovali za kreativní, objevilo své umělecké schopnosti prostřednictvím obrázků generovaných umělou inteligencí. Tato filozofie se odráží v uživatelském rozhraní platformy, které je navrženo tak, aby bylo uživatelsky přívětivé a přístupné umělcům všech úrovní dovedností. 

Jen na NightCafe Studio je již nyní mezi dvěma až třemi miliony uživatelů měsíčně, kteří generují kolem milionu obrázků denně. Stability AI, open-source generativní AI společnost, uvedený že měli přes 10 milionů uživatelů, kteří byli denně aktivní krátce po spuštění Stable Diffusion.

Doporučená: 10+ nejlepších generátorů umění AI roku 2023: Midjourney, DALL-E, NightCafe, Artbreeder

DeepFloyd IF: Nový algoritmus generování obrazu AI, který mění hru

NightCafe Studio implementuje nový algoritmus od Stability AI volal DeepFloyd, která slibuje revoluci ve způsobu generování obrázků pomocí umělé inteligence.

DeepFloyd, který je v současné době ve verzi beta, je nový model převodu textu na obrázek, který dokáže generovat působivé obrázky z popisů v přirozeném jazyce. Je založen na nové architektuře, která kombinuje velký jazykový model se třemi modely difúze. Je inspirován Imagenem, podobným modelem vyvinutým společností Google Research, ale nikdy nebyl zveřejněn.

Model může generovat jasné a koherentní obrázky s textem a objekty v různých prostorových vztazích, což je náročný úkol pro většinu ostatních modelů pro převod textu na obrázek. Toho je dosaženo pomocí velkého jazykového modelu T5-XXL-1.1 jako kodéru textu a značného množství vrstev pro vzájemnou pozornost mezi textem a obrazem, které poskytují lepší pohotové a obrazové spojení. 

DeepFloyd také umí vytvářet obrázky s nestandardním poměrem stran a má vysokou míru fotorealismu. Navíc umožňuje překlady z obrázku na obrázek s nulovým záběrem, což znamená, že styl, vzory a detaily výstupního obrázku lze upravit při zachování základní podoby zdrojového obrázku bez nutnosti dolaďování.

Nový algoritmus funguje jiným způsobem než Stable Diffusion. DeepFloyd využívá pixelový prostor a velký jazykový model (LLM), zatímco Stable Diffusion využívá latentní prostor a pevný model CLIP. DeepFloyd také používá k vytváření obrázků několik difúzních procesů Stable Diffusion používá pouze jeden.

DeepFloyd je název výzkumné skupiny, která vytvořila algoritmus, a samotný algoritmus se nazývá IF. Výzkumná skupina zahrnuje mnoho stejných lidí, kteří vytvořili GPT-3předchůdce, GPT-2a předchozí nejmodernější jazykový model s názvem RuGPT.

Některé spekulace naznačují, že název IF může být inspirován stejnojmennou písní Pink Floyd, jak naznačuje bios sociálních sítí výzkumné skupiny algoritmů.

Přečtěte si více o algoritmu zde.

studio noční kavárny deepfloyd
Obrázky generované pomocí DeepFloyd IF. Zdroj: Stability AI

Porovnání omezení AI Art a digitálního umění

Jedním z hlavních omezení AI je text, ačkoli DeepFloyd tento problém řeší. Dalším omezením je obtížnost získat obrázek přesně podle představ, zvláště bez nabádání odborníků. AI také postrádá schopnost porozumět a interpretovat kulturní a sociální kontexty, které formují lidské umění. Umění generované umělou inteligencí proto může někdy produkovat díla, která se zdají být nemístná nebo kulturně necitlivá.

Obrázky generované umělou inteligencí však mohou být stále krásné a někdy dokonce lepší než původní nápad, pokud je uživatel otevřený, aby byl překvapen, řekl Angus. Kromě toho existují způsoby, jak upravit generované obrázky pomocí algoritmů AI nebo Photoshopu. I když je získání přesného obrazu v současnosti oblastí aktivního výzkumu, dochází k výraznému pokroku. Brzy možná bude možné mít plnou kontrolu nad každým aspektem obrázku. 

AI se jako inspiraci spoléhá na obrázky a umění, které existují na webu, ale pouze na ty, na kterých byla vycvičena. Různé algoritmy, jako např Midjourney, DALL-E a Stable Diffusion, jsou trénováni na různých souborech dat, což znamená, že mohou fungovat lépe na konkrétních typech obrázků. 

Nedávno výzkumníci zkoumali dopad odstranění nekvalitních obrázků z tréninkových datových sad za účelem zlepšení výsledků AI. Odfiltrováním těchto nekvalitních obrázků se výsledný soubor dat může zmenšit, ale kvalitněji, což povede k lepším výsledkům, aniž by se zvětšila velikost modelů AI nebo vyžadoval dražší hardware. Angus sdílel, že tento přístup představuje slibný způsob, jak zlepšit kvalitu obrázků generovaných AI, aniž by se spoléhal na větší a na zdroje náročnější modely.

Jedním z problémů s umělou inteligencí v umění je, že může znehodnotit práci lidských umělců, kteří tráví mnoho času tvorbou umění, zatímco umělá inteligence je schopna generovat umění během několika sekund. Existuje však určitá nehmotná kvalita lidského umění, kterou může být pro umělou inteligenci obtížné napodobit, jako je emocionální hloubka a složitost často přítomná v dílech vytvořených lidmi. NightCafe Studio věří, že umělá inteligence je méně o vytváření umění pro komerční účely a více o požitku ze samotného tvůrčího procesu.

„Umění vytvořené člověkem bude mít vždy hodnotu, protože představuje úsilí a dovednosti umělce, zatímco umění generované umělou inteligencí nemá stejnou vnitřní hodnotu,“

Řekl Angus.

Etickým problémem souvisejícím s umělou inteligencí v umění je používání veřejného obrazu k trénování algoritmů umělé inteligence, které nemusí patřit společnosti školící umělou inteligenci. I když v současnosti nejsou porušeny žádné zákony, vyvolává to otázky ohledně souhlasu a soukromí. Open-source společnosti jako OpenAI a DALL-E pracují na tom, aby byl tento proces etičtější, ale zůstává to otevřenou otázkou. Mohou existovat budoucí předpisy týkající se používání obrázků k trénování umělé inteligence v umění.

Navzdory těmto obavám Angus věří, že proces umělé inteligence v umění se zásadně neliší od lidských umělců čerpajících inspiraci z prací jiných umělců. Umělá inteligence ví, jak věci vypadají, a pamatuje si kousky obrázků, stejně jako lidé. Je prostě lepší je znovu vytvořit od nuly.

Čtěte více:

Odmítnutí odpovědnosti

V souladu s Pokyny k projektu Trust, prosím vezměte na vědomí, že informace uvedené na této stránce nejsou určeny a neměly by být vykládány jako právní, daňové, investiční, finanční nebo jakékoli jiné formy poradenství. Je důležité investovat jen to, co si můžete dovolit ztratit, a v případě pochybností vyhledat nezávislé finanční poradenství. Pro další informace doporučujeme nahlédnout do smluvních podmínek a také na stránky nápovědy a podpory poskytnuté vydavatelem nebo inzerentem. MetaversePost se zavázala poskytovat přesné a nezaujaté zprávy, ale podmínky na trhu se mohou bez upozornění změnit.

O autorovi

Agne je novinářka, která se zabývá nejnovějšími trendy a vývojem v metaverse, AI a Web3 průmysl pro Metaverse Post. Její vášeň pro vyprávění ji přivedla k četným rozhovorům s odborníky v těchto oblastech, ve kterých se vždy snažila odhalit vzrušující a poutavé příběhy. Agne má bakalářský titul z literatury a má rozsáhlé zkušenosti s psaním o široké škále témat, včetně cestování, umění a kultury. Přihlásila se také jako redaktorka do organizace pro práva zvířat, kde pomáhala zvyšovat povědomí o otázkách dobrých životních podmínek zvířat. Kontaktujte ji [chráněno e-mailem].

Další články
Agne Cimermanová
Agne Cimermanová

Agne je novinářka, která se zabývá nejnovějšími trendy a vývojem v metaverse, AI a Web3 průmysl pro Metaverse Post. Její vášeň pro vyprávění ji přivedla k četným rozhovorům s odborníky v těchto oblastech, ve kterých se vždy snažila odhalit vzrušující a poutavé příběhy. Agne má bakalářský titul z literatury a má rozsáhlé zkušenosti s psaním o široké škále témat, včetně cestování, umění a kultury. Přihlásila se také jako redaktorka do organizace pro práva zvířat, kde pomáhala zvyšovat povědomí o otázkách dobrých životních podmínek zvířat. Kontaktujte ji [chráněno e-mailem].

Institucionální apetit roste směrem k bitcoinovým ETF uprostřed volatility

Zveřejnění prostřednictvím podání 13F odhaluje, že pozoruhodní institucionální investoři fušují do bitcoinových ETF, což podtrhuje rostoucí akceptaci...

Vědět více

Přichází den odsouzení: Osud CZ visí v rovnováze, protože americký soud zvažuje žalobu ministerstva spravedlnosti

Changpeng Zhao je dnes připraven čelit rozsudku u amerického soudu v Seattlu.

Vědět více
Připojte se k naší komunitě inovativních technologií
Více
Dozvědět se více
Injective spojuje síly s AltLayer, aby přineslo zabezpečení při opětovném skládání do inEVM
Business Novinky Technika
Injective spojuje síly s AltLayer, aby přineslo zabezpečení při opětovném skládání do inEVM
3
Masa se spojila s Tellerem, aby zavedla MASA Půjčovací fond, umožní USDC půjčování na základně
Trhy Novinky Technika
Masa se spojila s Tellerem, aby zavedla MASA Půjčovací fond, umožní USDC půjčování na základně
3
Velodrome spouští v nadcházejících týdnech beta verzi Superchain a rozšiřuje se o blockchainy OP Stack Layer 2
Trhy Novinky Technika
Velodrome spouští v nadcházejících týdnech beta verzi Superchain a rozšiřuje se o blockchainy OP Stack Layer 2
3
CARV oznamuje partnerství se společností Aethir za účelem decentralizace její datové vrstvy a distribuce odměn
Business Novinky Technika
CARV oznamuje partnerství se společností Aethir za účelem decentralizace její datové vrstvy a distribuce odměn
3
CRYPTOMERIA LABS PTE. LTD.