Interviu Artă SMW
01 Mai, 2023

DeepFloyd and Beyond: Explorând cele mai recente AI Art cu CEO-ul NightCafe Studio

Pe scurt

În timpul unui interviu exclusiv, CEO-ul NightCafe Studio a oferit perspective și perspective valoroase despre arta generată de AI.

Angus Russell a prezentat DeepFloyd – un nou algoritm dezvoltat de partenerul NightCafe Studio, Stability AI, care operează în spațiu de pixeli și utilizează un model de limbaj mare (LLM) pentru a genera imagini.

NightCafe Studio este un generator de artă AI care permite utilizatorilor să creeze artă uimitoare și futuristă în câteva secunde cu ajutorul inteligenței artificiale. Gasit de Angus Russell Acum patru ani, NightCafe Studio s-a născut din propria frustrare a lui Angus de a nu putea găsi piese de artă care să rezoneze cu el. Condus de cunoștințele că există algoritmi de transfer de stil, el a căutat un site web care să-i permită să creeze artă personalizată prin transferul de stil și să o imprime. 

Spre dezamăgirea lui, nu a putut găsi o astfel de platformă. Cu toate acestea, acest eșec a stârnit în el o idee inovatoare. El a decis să creeze o aplicație de transfer de stil neural pentru a crea artă generată de AI și a pus-o pe Reddit.

NightCafe Studio a apărut ca o platformă de generare text-to-image, fiind prima de acest gen. Această caracteristică unică a determinat o creștere semnificativă atât a veniturilor, cât și a bazei de utilizatori. De atunci, platforma a rămas în fruntea IA generativă, atrăgând o mare comunitate de entuziaști care se bucură să folosească generatorul pentru a crea lucrări de artă uimitoare. Astăzi, NightCafe Studio este considerat pe scară largă drept unul dintre cele mai populare și inovatoare generatoare de imagini AI disponibile.

În timpul unui interviu cu Angus Russell, am explorat beneficiile și limitările artei generate de AI, utilizarea tot mai mare a inteligenței artificiale în lumea artei și cel mai recent algoritm de generare de imagini AI, DeepFloyd.

studio cafenea de noapte
Sydney Opera House: Una dintre primele imagini ale lui Angus generate de AI

Apariția art

În ultimul deceniu, industria artei a asistat la o infiltrare treptată a AI și a învățării automate (ML). Aceste tehnologii de ultimă oră au introdus câteva concepte noi fascinante, cum ar fi Deepfakes și DALĂ, care au câștigat o atenție semnificativă pe tot globul. Astăzi, industria artei nu își poate permite să ignore impactul imens al inteligenței artificiale, care declanșează acum o revoluție de mult așteptată în sector.

Angus a discutat despre modul în care NightCafe Studio a experimentat creșteri în timpul lansării Stable Diffusion, un model text-to-image cu care compania sa a intrat în direct în ziua lansării. De atunci, bariera de intrare pentru crearea de instrumente similare a fost coborâtă datorită aprovizionării cu surse deschise a algoritmilor și a codurilor eșantioane.

Fondatorul NightCafe Studio consideră că crearea artei AI nu se referă doar la produsul final, ci și la procesul de creare a acestuia. El o vede ca pe o formă de terapie și relaxare, care le permite oamenilor să se exprime în moduri unice și creative. Mulți oameni care nu s-au considerat niciodată creativi și-au descoperit abilitățile artistice prin intermediul imaginilor generate de AI. Această filozofie se reflectă în interfața de utilizator a platformei, care este concepută pentru a fi ușor de utilizat și accesibilă artiștilor de toate nivelurile de calificare. 

Numai pe NightCafe Studio există deja între două și trei milioane de utilizatori pe lună, generând aproximativ un milion de imagini pe zi. Stability AI, o companie de IA generativă cu sursă deschisă, stabilit că aveau peste 10 milioane de utilizatori care erau activi zilnic la scurt timp după lansarea Stable Diffusion.

Recomandat: Cele mai bune 10 generatoare de artă AI din 2023: Midjourney, DALL-E, NightCafe, Artbreeder

DeepFloyd IF: Noul algoritm de generare de imagini AI care schimbă jocul

NightCafe Studio implementează un nou algoritm prin Stability AI denumit DeepFloyd, care promite să revoluționeze modul în care generăm imagini cu inteligență artificială.

DeepFloyd, care este în prezent în versiune beta, este un nou model text-to-image care poate genera imagini impresionante din descrierile în limbaj natural. Se bazează pe o arhitectură nouă care combină un model de limbaj mare cu trei modele de difuzie. Este inspirat de Imagen, un model similar dezvoltat de Google Research, dar niciodată lansat publicului.

Modelul poate genera imagini clare și coerente cu text și obiecte în diferite relații spațiale, ceea ce este o sarcină dificilă pentru majoritatea celorlalte modele text-to-image. Acest lucru se realizează folosind modelul de limbă mare T5-XXL-1.1 ca codificator de text și o cantitate semnificativă de straturi de atenție încrucișată text-imagine care oferă o mai bună alianță de prompt și imagine. 

DeepFloyd poate crea și imagini cu un raport de aspect non-standard și are un grad ridicat de fotorealism. În plus, permite traduceri zero-shot de la imagine la imagine, ceea ce înseamnă că stilul, modelele și detaliile unei imagini de ieșire pot fi modificate, păstrând în același timp forma de bază a imaginii sursă, fără a fi nevoie de o reglare fină.

Noul algoritm funcționează într-un mod diferit decât Stable Diffusion. DeepFloyd utilizează spațiu în pixeli și un model de limbaj mare (LLM), în timp ce Stable Diffusion folosește spațiu latent și un model CLIP fix. DeepFloyd folosește, de asemenea, mai multe procese de difuzie pentru a crea imagini, în timp ce Stable Diffusion folosește doar unul singur.

DeepFloyd este numele grupului de cercetare care a construit algoritmul, iar algoritmul în sine se numește IF. Grupul de cercetare include mulți dintre aceiași oameni care au creat GPT-3predecesorul lui, GPT-2, și un model de limbaj anterior de ultimă generație numit RuGPT.

Unele speculații sugerează că numele IF ar putea fi inspirat de o melodie a Pink Floyd cu același nume, așa cum este sugerat de biografia rețelelor sociale a grupului de cercetare al algoritmului.

Citiți mai multe despre algoritm aici.

studioul deepfloyd nightcafe
Imagini generate cu DeepFloyd IF. Sursă: Stability AI

Comparând limitările artei AI și arta digitală

Una dintre limitările majore ale AI este textul, deși DeepFloyd abordează această problemă. O altă limitare este dificultatea de a obține o imagine exact așa cum a fost preconizată, mai ales fără solicitarea expertului. AI nu are, de asemenea, capacitatea de a înțelege și interpreta contexte culturale și sociale care modelează arta umană. Prin urmare, arta generată de inteligența artificială poate produce uneori lucrări care par deplasate sau insensibile din punct de vedere cultural.

Cu toate acestea, imaginile generate de AI pot fi în continuare frumoase și uneori chiar mai bune decât ideea originală, atâta timp cât utilizatorul este deschis să fie surprins, a spus Angus. În plus, există modalități de a modifica imagini generate folosind algoritmi AI sau Photoshop. Deși obținerea unei imagini exacte este în prezent un domeniu de cercetare activă, se fac progrese semnificative. În curând va fi posibil să aveți control deplin asupra fiecărui aspect al unei imagini. 

AI se bazează pe imaginile și arta care există pe web ca inspirație, dar numai pe acelea pentru care a fost antrenat. Algoritmi diferiți, cum ar fi Midjourney, DALL-E și Stable Diffusion, sunt instruiți pe diferite seturi de date, ceea ce înseamnă că pot funcționa mai bine pe anumite tipuri de imagini. 

Recent, cercetătorii au investigat impactul eliminării imaginilor de calitate scăzută din seturile de date de antrenament pentru a îmbunătăți rezultatele AI. Prin filtrarea acestor imagini de calitate scăzută, setul de date rezultat poate deveni mai mic, dar de calitate superioară, ceea ce duce la rezultate mai bune fără a crește dimensiunea modelelor AI sau a necesita hardware mai scump. Angus a spus că această abordare reprezintă o modalitate promițătoare de a îmbunătăți calitatea imaginilor generate de inteligență artificială, fără a se baza pe modele mai mari și mai mari consumatoare de resurse.

O problemă cu AI în artă este că poate devaloriza munca artiștilor umani, care petrec mult timp creând artă, în timp ce AI este capabilă să genereze artă în câteva secunde. Cu toate acestea, există o anumită calitate intangibilă a artei umane care poate fi dificil de reprodus pentru AI, cum ar fi profunzimea emoțională și complexitatea adesea prezente în lucrările create de oameni. NightCafe Studio consideră că AI este mai puțin despre crearea de artă în scopuri comerciale și mai mult despre bucuria procesului creativ în sine.

„Va exista întotdeauna valoare în arta creată de om, deoarece reprezintă efortul și priceperea artistului, în timp ce arta generată de IA nu are aceeași valoare intrinsecă.”

Spuse Angus.

O problemă etică în jurul AI în artă este utilizarea imaginii publice pentru a antrena algoritmi AI care ar putea să nu aparțină companiei care antrenează AI. Deși în prezent nu există legi încălcate, ridică întrebări despre consimțământ și confidențialitate. Companii open-source cum ar fi OpenAI și DALL-E lucrează pentru a face procesul mai etic, dar rămâne o întrebare deschisă. Pot exista reglementări viitoare cu privire la utilizarea imaginilor pentru instruirea AI în art.

În ciuda acestor preocupări, Angus consideră că procesul de inteligență artificială în artă nu este fundamental diferit de artiștii umani care se inspiră din munca altor artiști. AI știe cum arată lucrurile și își amintește fragmente despre imagini, la fel ca oamenii. Pur și simplu este mai bine să le recreezi de la zero.

Citeşte mai mult:

Declinare a responsabilităţii

În conformitate cu Ghidurile proiectului Trust, vă rugăm să rețineți că informațiile furnizate pe această pagină nu sunt destinate și nu trebuie interpretate ca fiind consiliere juridică, fiscală, investițională, financiară sau orice altă formă de consiliere. Este important să investești doar ceea ce îți poți permite să pierzi și să cauți sfaturi financiare independente dacă ai îndoieli. Pentru informații suplimentare, vă sugerăm să consultați termenii și condițiile, precum și paginile de ajutor și asistență furnizate de emitent sau agent de publicitate. MetaversePost se angajează să raporteze corecte, imparțial, dar condițiile de piață pot fi modificate fără notificare.

Despre autor

Agne este o jurnalistă care acoperă cele mai recente tendințe și evoluții în metaverse, AI și Web3 industrii pentru Metaverse Post. Pasiunea ei pentru povestire a determinat-o să conducă numeroase interviuri cu experți în aceste domenii, căutând mereu să descopere povești interesante și captivante. Agne deține o diplomă de licență în literatură și are o experiență vastă în scris despre o gamă largă de subiecte, inclusiv călătorii, artă și cultură. De asemenea, s-a oferit voluntar ca editor pentru organizația pentru drepturile animalelor, unde a contribuit la creșterea gradului de conștientizare cu privire la problemele de bunăstare a animalelor. Contactează-o pe [e-mail protejat].

Mai multe articole
Agne Cimerman
Agne Cimerman

Agne este o jurnalistă care acoperă cele mai recente tendințe și evoluții în metaverse, AI și Web3 industrii pentru Metaverse Post. Pasiunea ei pentru povestire a determinat-o să conducă numeroase interviuri cu experți în aceste domenii, căutând mereu să descopere povești interesante și captivante. Agne deține o diplomă de licență în literatură și are o experiență vastă în scris despre o gamă largă de subiecte, inclusiv călătorii, artă și cultură. De asemenea, s-a oferit voluntar ca editor pentru organizația pentru drepturile animalelor, unde a contribuit la creșterea gradului de conștientizare cu privire la problemele de bunăstare a animalelor. Contactează-o pe [e-mail protejat].

Apetitul instituțional crește față de ETF-urile Bitcoin pe fondul volatilității

Dezvăluirile prin dosarele 13F dezvăluie investitori instituționali de seamă care se amestecă în ETF-uri Bitcoin, subliniind o acceptare tot mai mare a...

Aflați mai multe

Sosește ziua sentinței: soarta lui CZ este în echilibru, în timp ce tribunalul american ia în considerare pledoaria DOJ

Changpeng Zhao este pe cale de a fi condamnat astăzi într-un tribunal american din Seattle.

Aflați mai multe
Alăturați-vă comunității noastre tehnologice inovatoare
Citeste mai mult
Află mai multe
Injective își unește forțele cu AltLayer pentru a aduce securitatea refacerii în EVM
Afaceri Buletin de stiri Tehnologia
Injective își unește forțele cu AltLayer pentru a aduce securitatea refacerii în EVM
3 Mai, 2024
Masa face echipă cu Teller pentru a introduce grupul de împrumuturi MASA, care permite împrumuturile USDC pe bază
pieţe Buletin de stiri Tehnologia
Masa face echipă cu Teller pentru a introduce grupul de împrumuturi MASA, care permite împrumuturile USDC pe bază
3 Mai, 2024
Velodrome lansează versiunea Beta a Superchain în săptămânile următoare și se extinde în blockchainurile OP Stack Layer 2
pieţe Buletin de stiri Tehnologia
Velodrome lansează versiunea Beta a Superchain în săptămânile următoare și se extinde în blockchainurile OP Stack Layer 2
3 Mai, 2024
CARV anunță parteneriat cu Aethir pentru a-și descentraliza stratul de date și a distribui recompense
Afaceri Buletin de stiri Tehnologia
CARV anunță parteneriat cu Aethir pentru a-și descentraliza stratul de date și a distribui recompense
3 Mai, 2024
CRYPTOMERIA LABS PTE. LTD.