Interjú Művészet Smw
May 01, 2023

DeepFloyd and Beyond: Fedezze fel a legújabb mesterséges intelligencia művészetet a NightCafe Studio vezérigazgatójával

Röviden

Egy exkluzív interjú során a NightCafe Studio vezérigazgatója értékes betekintést és perspektívát adott az AI által generált művészetről.

Angus Russell bemutatta a DeepFloyd nevű új algoritmust, amelyet a NightCafe Studio partnere fejlesztett ki. Stability AI, amely pixeltérben működik, és nagy nyelvi modellt (LLM) használ a képek előállításához.

NightCafe Stúdió egy AI Art Generator, amely lehetővé teszi a felhasználók számára, hogy a mesterséges intelligencia segítségével másodpercek alatt lenyűgöző és futurisztikus művészetet hozzanak létre. Alapította Angus Russell Négy évvel ezelőtt a NightCafe Stúdió Angus saját frusztrációjából született, amiért nem talált olyan műalkotásokat, amelyek megszólaltatták őt. Attól a tudattól vezérelve, hogy léteznek stílusátviteli algoritmusok, olyan webhelyet keresett, amely lehetővé teszi számára, hogy stílustranszfer segítségével személyre szabott művészetet hozzon létre, és kinyomtassa. 

Csalódására nem talált ilyen platformot. Ez a visszaesés azonban újító ötletet váltott ki benne. Úgy döntött, hogy létrehoz egy neurális stílusátviteli alkalmazást a mesterséges intelligencia által generált művészet létrehozásához, és feltette a Redditre.

A NightCafe Studio egy szöveg-képgeneráló platformként jött létre, így ez az első a maga nemében. Ez az egyedülálló funkció a bevételek és a felhasználói bázis jelentős megugrását eredményezte. Azóta a platform a generatív mesterséges intelligencia élvonalában maradt, és a rajongók nagy közösségét vonzza, akik örömmel használják a generátort lenyűgöző műalkotások létrehozására. Ma a NightCafe Studio-t széles körben az egyik legnépszerűbb és leginnovatívabb mesterséges intelligencia képgenerátorként tartják számon.

Az Angus Russell-lel készült interjú során feltártuk a mesterséges intelligencia által generált művészet előnyeit és korlátait, a mesterséges intelligencia egyre növekvő használatát a művészeti világban, valamint a legújabb mesterséges intelligencia képgeneráló algoritmust, a DeepFloyd-ot.

éjszakai kávézó stúdió
Sydney Operaház: Angus egyik első mesterséges intelligencia által generált képei

A mesterséges intelligencia által generált művészet megjelenése

Az elmúlt évtizedben a művészeti ipar az AI és a gépi tanulás (ML) fokozatos beszivárgásának volt tanúja. Ezek az élvonalbeli technológiák néhány lenyűgöző új koncepciót vezettek be, mint például a Deepfakes és DALL-E, amelyek világszerte jelentős figyelmet kaptak. Ma a művészeti ipar nem engedheti meg magának, hogy figyelmen kívül hagyja a mesterséges intelligencia hatalmas hatását, amely most már régóta esedékes forradalmat indít el az ágazatban.

Angus arról beszélt, hogy a NightCafe Studio hogyan tapasztalt növekedési kiugrásokat a megjelenése során Stable Diffusion, egy szöveg-képmodell, amellyel cége az indulás napján élni kezdett. Azóta az algoritmusok és mintakódok nyílt forrású forráskódja miatt csökkent a belépési korlát a hasonló eszközök létrehozásához.

A NightCafe Studio alapítója úgy véli, hogy az AI művészet létrehozása nem csak a végtermékről szól, hanem a létrehozásának folyamatáról is. A terápia és a relaxáció egy formájának tekinti, amely lehetővé teszi az emberek számára, hogy egyedi és kreatív módon fejezzék ki magukat. Sokan, akik soha nem tartották magukat kreatívnak, az MI által generált képeken fedezték fel művészi képességeiket. Ezt a filozófiát tükrözi a platform felhasználói felülete, amelyet úgy alakítottak ki, hogy felhasználóbarát legyen, és minden képzettségi szintű művész számára elérhető legyen. 

Csak a NightCafe Stúdióban már havonta két-három millió felhasználó van, naponta körülbelül egymillió képet generálva. Stability AI, egy nyílt forráskódú generatív AI vállalat, meghatározott hogy több mint 10 millió felhasználójuk volt naponta, röviddel a megjelenése után Stable Diffusion.

Ajánlott: 10 2023+ legjobb mesterséges intelligencia-generátora: Midjourney, DALL-E, NightCafe, Artbreeder

DeepFloyd IF: Az új játékot megváltoztató mesterséges intelligencia képgenerálási algoritmus

A NightCafe Studio új algoritmust valósít meg Stability AI hívott DeepFloyd, amely azt ígéri, hogy forradalmasítja azt, ahogyan mesterséges intelligenciával képeket generálunk.

A jelenleg béta verzióban lévő DeepFloyd egy új szöveg-képmodell, amely lenyűgöző képeket képes generálni természetes nyelvű leírásokból. Egy újszerű architektúrán alapul, amely egy nagy nyelvi modellt három diffúziós modellel kombinál. Az Imagen ihlette, egy hasonló modell, amelyet a Google Research fejlesztett ki, de soha nem hozták nyilvánosságra.

A modell tiszta és koherens képeket tud generálni szöveggel és objektumokkal különböző térbeli kapcsolatokban, ami a legtöbb más szöveg-kép modell esetében kihívást jelent. Ezt a T5-XXL-1.1 nagy nyelvi modell szövegkódolóként és jelentős mennyiségű szöveg-kép keresztfigyelem réteg használatával érik el, amelyek jobb prompt és kép szövetséget biztosítanak. 

A DeepFloyd nem szabványos képarányú képeket is tud készíteni, és magas fokú fotorealizmussal rendelkezik. Ezen kívül lehetővé teszi a nulla felvétel nélküli képről képre fordítást, ami azt jelenti, hogy a kimeneti kép stílusa, mintái és részletei finomhangolás nélkül módosíthatók a forráskép alapformájának megőrzése mellett.

Az új algoritmus más módon működik, mint Stable Diffusion. A DeepFloyd pixelteret és nagy nyelvi modellt (LLM) használ, míg Stable Diffusion látens teret és rögzített CLIP-modellt használ. A DeepFloyd többféle diffúziós folyamatot is használ a képek létrehozásához, miközben Stable Diffusion csak egyet használ.

A DeepFloyd az algoritmust felépítő kutatócsoport neve, magát az algoritmust pedig IF-nek hívják. A kutatócsoportban sok olyan ember van, akik létrehozták GPT-3elődje, GPT-2, és egy korábbi, legmodernebb nyelvi modell, a RuGPT.

Egyes spekulációk azt sugallják, hogy az IF nevet egy azonos nevű Pink Floyd-dal ihlette, amint arra az algoritmuskutató csoport közösségimédia-életrajza utal.

Olvasson többet az algoritmusról itt.

deepfloyd nightcafe stúdió
A DeepFloyd IF segítségével generált képek. Forrás: Stability AI

A mesterséges intelligencia korlátainak és a digitális művészet összehasonlítása

Az AI egyik fő korlátozása a szöveg, bár a DeepFloyd foglalkozik ezzel a problémával. Egy másik korlát az, hogy nehéz pontosan olyan képet készíteni, amilyennek elképzeltük, különösen szakértői felszólítás nélkül. Az AI sem képes megérteni és értelmezni a az emberi művészetet formáló kulturális és társadalmi összefüggések. Ezért a mesterséges intelligencia által generált művészet néha oda nem illő vagy kulturálisan érzéketlennek tűnő alkotásokat hozhat létre.

A mesterséges intelligencia által generált képek azonban továbbra is lehetnek szépek, és időnként még jobbak is, mint az eredeti ötlet, mindaddig, amíg a felhasználó nyitott a meglepetésre, mondta Angus. Emellett vannak módok a módosítására AI algoritmusok vagy Photoshop segítségével generált képeket. Míg a pontos kép elkészítése jelenleg aktív kutatási terület, jelentős előrelépés történik. Hamarosan lehetségessé válik a kép minden aspektusa feletti teljes ellenőrzés. 

A mesterséges intelligencia a weben található képekre és művészetekre támaszkodik inspirációként, de csak azokra, amelyekre kiképezték. Különböző algoritmusok, mint pl Midjourney, DALL-E és Stable Diffusion, különböző adatkészletekre vannak kiképezve, ami azt jelenti, hogy bizonyos típusú képeken jobban teljesíthetnek. 

A közelmúltban a kutatók azt vizsgálták, milyen hatással lehet az alacsony minőségű képek képzési adatkészletekből való eltávolítása az AI-eredmények javítása érdekében. Az ilyen rossz minőségű képek kiszűrésével az eredményül kapott adathalmaz kisebb, de jobb minőségű lehet, ami jobb eredményeket eredményezhet anélkül, hogy az AI-modellek méretét növelné, vagy drágább hardverre lenne szükség. Angus megosztotta, hogy ez a megközelítés ígéretes módot jelent az AI által generált képek minőségének javítására anélkül, hogy nagyobb és erőforrás-igényesebb modellekre támaszkodna.

A mesterséges intelligencia egyik problémája a művészetben az, hogy leértékelheti az emberi művészek munkáját, akik sok időt töltenek művészet létrehozásával, miközben az AI pillanatok alatt képes művészetet generálni. Az emberi művészetnek azonban van egy bizonyos megfoghatatlan tulajdonsága, amelyet a mesterséges intelligencia nehezen reprodukálhat, például az érzelmi mélység és az összetettség, amely gyakran jelen van az ember által létrehozott alkotásokban. A NightCafe Studio úgy véli, hogy a mesterséges intelligencia kevésbé a kereskedelmi célú művészet létrehozásáról szól, hanem magának a kreatív folyamatnak az élvezetéről.

"Az ember alkotta művészetnek mindig lesz értéke, mert a művész erőfeszítéseit és készségeit képviseli, míg a mesterséges intelligencia által generált művészet nem rendelkezik ugyanazzal a belső értékkel."

- mondta Angus.

A művészetben a mesterséges intelligencia körüli etikai probléma a nyilvános képhasználat olyan mesterségesintelligencia-algoritmusok betanítására, amelyek nem tartoznak az AI-t kiképző vállalathoz. Bár jelenleg nem sértenek törvényt, ez kérdéseket vet fel a beleegyezéssel és az adatvédelemmel kapcsolatban. A nyílt forráskódú cégek, mint pl OpenAI és a DALL-E azon dolgozik, hogy etikusabbá tegye a folyamatot, de ez továbbra is nyitott kérdés. A jövőben szabályozások születhetnek a képeknek a mesterséges intelligencia művészetben való betanítására való felhasználására vonatkozóan.

Ezen aggodalmak ellenére Angus úgy véli, hogy a mesterséges intelligencia folyamata a művészetben nem különbözik alapvetően attól, hogy az emberi művészek más művészek munkáiból merítenek ihletet. A mesterséges intelligencia tudja, hogyan néznek ki a dolgok, és emlékszik a képek részleteire, akárcsak az emberek. Egyszerűen jobb újra létrehozni őket a semmiből.

Bővebben:

A felelősség megtagadása

Összhangban a A Trust Project irányelvei, kérjük, vegye figyelembe, hogy az ezen az oldalon közölt információk nem minősülnek jogi, adózási, befektetési, pénzügyi vagy bármilyen más formájú tanácsnak, és nem is értelmezhetők. Fontos, hogy csak annyit fektessen be, amennyit megengedhet magának, hogy elveszítsen, és kérjen független pénzügyi tanácsot, ha kétségei vannak. További információkért javasoljuk, hogy tekintse meg a szerződési feltételeket, valamint a kibocsátó vagy hirdető által biztosított súgó- és támogatási oldalakat. MetaversePost elkötelezett a pontos, elfogulatlan jelentéstétel mellett, de a piaci feltételek előzetes értesítés nélkül változhatnak.

A szerzőről

Agne újságíró, aki a metaverzum legújabb trendjeivel és fejleményeivel foglalkozik, az AI és Web3 iparágak számára Metaverse Post. A történetmesélés iránti szenvedélye arra késztette, hogy számos interjút készített e területek szakértőivel, mindig izgalmas és lebilincselő történetek feltárására törekedve. Agne irodalomból bachelor diplomát szerzett, és széleskörű írási háttérrel rendelkezik számos témakörben, beleértve az utazást, a művészetet és a kultúrát. Önkéntesként jelentkezett szerkesztőként az állatvédő szervezetnél is, ahol segített felhívni a figyelmet az állatjóléti kérdésekre. Vegye fel vele a kapcsolatot [e-mail védett].

További cikkek
Cimerman Ágne
Cimerman Ágne

Agne újságíró, aki a metaverzum legújabb trendjeivel és fejleményeivel foglalkozik, az AI és Web3 iparágak számára Metaverse Post. A történetmesélés iránti szenvedélye arra késztette, hogy számos interjút készített e területek szakértőivel, mindig izgalmas és lebilincselő történetek feltárására törekedve. Agne irodalomból bachelor diplomát szerzett, és széleskörű írási háttérrel rendelkezik számos témakörben, beleértve az utazást, a művészetet és a kultúrát. Önkéntesként jelentkezett szerkesztőként az állatvédő szervezetnél is, ahol segített felhívni a figyelmet az állatjóléti kérdésekre. Vegye fel vele a kapcsolatot [e-mail védett].

A volatilitás közepette nő az intézményi étvágy a Bitcoin ETF-ek felé

A 13F bejelentéseken keresztül közzétett információk jelentős intézményi befektetőket tárnak fel a Bitcoin ETF-ek iránt, ami alátámasztja a ...

Tudjon meg többet

Elérkezett az ítélethirdetés napja: CZ sorsa egyensúlyban van, mivel az Egyesült Államok bírósága mérlegeli a DOJ kérelmét

Changpeng Zhao ítéletet vár ma egy seattle-i amerikai bíróságon.

Tudjon meg többet
Csatlakozzon innovatív technológiai közösségünkhöz
KATT ide
Tovább
Az Injective egyesíti erőit az AltLayerrel, hogy biztonságot nyújtson az inEVM számára
üzleti Tudósítást Technológia
Az Injective egyesíti erőit az AltLayerrel, hogy biztonságot nyújtson az inEVM számára
May 3, 2024
A Masa a Tellerrel együttműködve bevezeti a MASA hitelintézetet, amely lehetővé teszi az USDC hitelfelvételt.
piacok Tudósítást Technológia
A Masa a Tellerrel együttműködve bevezeti a MASA hitelintézetet, amely lehetővé teszi az USDC hitelfelvételt.
May 3, 2024
A Velodrome a következő hetekben elindítja a Superchain béta verzióját, és az OP Stack Layer 2 blokkláncaira is kiterjed
piacok Tudósítást Technológia
A Velodrome a következő hetekben elindítja a Superchain béta verzióját, és az OP Stack Layer 2 blokkláncaira is kiterjed
May 3, 2024
A CARV partnerséget hirdet az Aethirrel adatrétegének decentralizálása és a jutalmak elosztása érdekében
üzleti Tudósítást Technológia
A CARV partnerséget hirdet az Aethirrel adatrétegének decentralizálása és a jutalmak elosztása érdekében
May 3, 2024
CRYPTOMERIA LABS PTE. KFT.