Intervju Konst SMW
Maj 01, 2023

DeepFloyd and Beyond: Utforska det senaste inom AI-konst med NightCafe Studios VD

I korthet

Under en exklusiv intervju gav VD:n för NightCafe Studio värdefulla insikter och perspektiv på AI-genererad konst.

Angus Russell introducerade DeepFloyd – en ny algoritm utvecklad av NightCafe Studios partner, Stability AI, som arbetar i pixelutrymme och använder en Large Language Model (LLM) för att generera bilder.

NightCafe Studio är en AI Art Generator som låter användare skapa fantastisk och futuristisk konst på några sekunder med hjälp av artificiell intelligens. Grundad av Angus Russell För fyra år sedan föddes NightCafe Studio ur Angus egen frustration över att inte kunna hitta konstverk som gav genklang hos honom. Driven av kunskapen om att stilöverföringsalgoritmer fanns, sökte han efter en webbplats som skulle göra det möjligt för honom att skapa personlig konst genom stilöverföring och skriva ut den. 

Till sin besvikelse kunde han inte hitta en sådan plattform. Men detta bakslag utlöste en innovativ idé hos honom. Han bestämde sig för att skapa en app för överföring av neural stil för att skapa AI-genererad konst, och han lade upp den på Reddit.

NightCafe Studio har sitt ursprung som en text-till-bild-genereringsplattform, vilket gör den till den första i sitt slag. Denna unika funktion medförde en betydande ökning av både intäkter och användarbas. Sedan dess har plattformen legat i framkanten av generativ AI och lockat till sig en stor grupp av entusiaster som njuter av att använda generatorn för att skapa fantastiska konstverk. Idag anses NightCafe Studio allmänt vara en av de mest populära och innovativa AI-bildgeneratorerna som finns.

Under en intervju med Angus Russell utforskade vi fördelarna och begränsningarna med AI-genererad konst, den ökande användningen av artificiell intelligens i konstvärlden och den senaste AI-bildgenereringsalgoritmen, DeepFloyd.

nattcafé studio
Sydney Opera House: En av Angus första AI-genererade bilder

Uppkomsten av AI-genererad konst

Under det senaste decenniet har konstindustrin sett en gradvis infiltration av AI och maskininlärning (ML). Dessa banbrytande teknologier har introducerat några fascinerande nya koncept, som Deepfakes och DALL-E, som har fått stor uppmärksamhet över hela världen. Idag har konstindustrin inte råd att ignorera den enorma effekten av AI, som nu utlöser en sedan länge försenad revolution i sektorn.

Angus diskuterade hur NightCafe Studio upplevde toppar i tillväxt under släppet av Stable Diffusion, en text-till-bild-modell som hans företag gick live med på lanseringsdagen. Sedan dess har inträdesbarriären för att skapa liknande verktyg sänkts på grund av öppen källa för algoritmer och exempelkoder.

NightCafe Studios grundare tror att att skapa AI-konst inte bara handlar om slutprodukten utan också om processen att skapa den. Han ser det som en form av terapi och avkoppling, som låter människor uttrycka sig på unika och kreativa sätt. Många människor som aldrig ansett sig vara kreativa har upptäckt sina konstnärliga förmågor genom AI-genererade bilder. Denna filosofi återspeglas i plattformens användargränssnitt, som är designat för att vara användarvänligt och tillgängligt för artister på alla nivåer. 

Bara på NightCafe Studio finns det redan mellan två och tre miljoner användare per månad, vilket genererar runt en miljon bilder per dag. Stability AI, ett generativt AI-företag med öppen källkod, anges att de hade över 10 miljoner användare som var aktiva dagligen kort efter lanseringen av Stable Diffusion.

Rekommenderas: 10+ bästa AI Art Generatorer 2023: Midjourney, DALL-E, NightCafe, Artbreeder

DeepFloyd IF: The New Game-Changing AI Image Generation Algorithm

NightCafe Studio implementerar en ny algoritm av Stability AI kallas DeepFloyd, som lovar att revolutionera hur vi genererar bilder med artificiell intelligens.

DeepFloyd, som för närvarande är i beta, är en ny text-till-bild-modell som kan generera imponerande bilder från naturliga språkbeskrivningar. Den är baserad på en ny arkitektur som kombinerar en stor språkmodell med tre spridningsmodeller. Den är inspirerad av Imagen, en liknande modell utvecklad av Google Research men aldrig släppt till allmänheten.

Modellen kan generera tydliga och sammanhängande bilder med text och objekt i olika rumsliga relationer, vilket är en utmanande uppgift för de flesta andra text-till-bild-modeller. Detta uppnås med hjälp av den stora språkmodellen T5-XXL-1.1 som textkodare och en betydande mängd text-bild-korsuppmärksamhetslager som ger bättre prompt och bildallians. 

DeepFloyd kan också skapa bilder med ett icke-standardiserat bildförhållande och har en hög grad av fotorealism. Dessutom tillåter det noll-shot bild-till-bild översättningar, vilket innebär att stilen, mönstren och detaljerna i en utgående bild kan modifieras samtidigt som den grundläggande formen av källbilden bibehålls utan behov av finjustering.

Den nya algoritmen fungerar på ett annat sätt än Stable Diffusion. DeepFloyd använder pixelutrymme och en stor språkmodell (LLM), medan Stable Diffusion använder latent utrymme och en fast CLIP-modell. DeepFloyd använder också flera diffusionsprocesser för att skapa bilder, medan Stable Diffusion använder bara en enda.

DeepFloyd heter forskargruppen som byggde algoritmen och själva algoritmen heter IF. I forskargruppen ingår många av samma personer som skapade GPT-3föregångare, GPT-2, och en tidigare toppmodern språkmodell som heter RuGPT.

Vissa spekulationer tyder på att namnet IF kan vara inspirerat av en Pink Floyd-låt med samma namn, vilket antyds av algoritmforskningsgruppens bios för sociala medier.

Läs mer om algoritmen här..

deepfloyd nattcafé studio
Bilder genererade med DeepFloyd IF. Källa: Stability AI

Jämför AI Art Begränsningar och Digital Art

En av de stora AI-begränsningarna är text, även om DeepFloyd tar itu med det här problemet. En annan begränsning är svårigheten att få en bild exakt som man tänkt sig, speciellt utan expertmaning. AI saknar också förmågan att förstå och tolka kulturella och sociala sammanhang som formar mänsklig konst. Därför kan AI-genererad konst ibland producera verk som verkar malplacerade eller kulturellt okänsliga.

Men AI-genererade bilder kan fortfarande vara vackra och ibland till och med bättre än den ursprungliga idén, så länge användaren är öppen för att bli överraskad, sa Angus. Dessutom finns det sätt att ändra genererade bilder med hjälp av AI-algoritmer eller Photoshop. Samtidigt som att få en exakt bild för närvarande är ett område för aktiv forskning, görs betydande framsteg. Det kan snart vara möjligt att ha full kontroll över alla aspekter av en bild. 

AI förlitar sig på bilderna och konsten som finns på webben som inspiration, men bara de som den har tränats på. Olika algoritmer, som t.ex Midjourney, DALL-E och Stable Diffusion, är utbildade i olika datamängder, vilket innebär att de kan prestera bättre på specifika typer av bilder. 

Nyligen har forskare undersökt effekten av att ta bort bilder av låg kvalitet från träningsdatauppsättningar för att förbättra AI-resultaten. Genom att filtrera bort dessa bilder av låg kvalitet kan den resulterande datamängden bli mindre men högre kvalitet, vilket leder till bättre resultat utan att öka storleken på AI-modeller eller kräva dyrare hårdvara. Angus berättade att detta tillvägagångssätt representerar ett lovande sätt att förbättra kvaliteten på AI-genererade bilder utan att förlita sig på större och mer resurskrävande modeller.

Ett problem med AI i konst är att det kan devalvera mänskliga konstnärers arbete, som spenderar mycket tid på att skapa konst, medan AI kan generera konst på några sekunder. Men det finns en viss immateriell kvalitet i mänsklig konst som kan vara svår för AI att replikera, såsom det känslomässiga djupet och komplexiteten som ofta finns i mänskligt skapade verk. NightCafe Studio tror att AI handlar mindre om att skapa konst för kommersiella syften och mer om att njuta av själva den kreativa processen.

"Det kommer alltid att finnas värde i mänskligt skapad konst eftersom den representerar konstnärens ansträngning och skicklighet, medan AI-genererad konst inte har samma inneboende värde."

sa Angus.

En etisk fråga kring AI i konst är den offentliga bildanvändningen för att träna AI-algoritmer som kanske inte tillhör företaget som utbildar AI. Även om det för närvarande inte bryts några lagar, väcker det frågor om samtycke och integritet. Företag med öppen källkod som OpenAI och DALL-E arbetar med att göra processen mer etisk, men det är fortfarande en öppen fråga. Det kan finnas framtida bestämmelser kring användningen av bilder för att träna AI i konst.

Trots dessa farhågor tror Angus att processen med AI i konsten inte skiljer sig fundamentalt från mänskliga konstnärer som hämtar inspiration från andra konstnärers arbete. AI vet hur saker ser ut och minns bitar om bilder, precis som människor gör. Det är helt enkelt bättre på att återskapa dem från grunden.

Läs mer:

Villkor

I linje med den Riktlinjer för Trust Project, vänligen notera att informationen på den här sidan inte är avsedd att vara och inte ska tolkas som juridisk, skattemässig, investerings-, finansiell eller någon annan form av rådgivning. Det är viktigt att bara investera det du har råd att förlora och att söka oberoende finansiell rådgivning om du har några tvivel. För ytterligare information föreslår vi att du hänvisar till villkoren samt hjälp- och supportsidorna som tillhandahålls av utfärdaren eller annonsören. MetaversePost är engagerad i korrekt, opartisk rapportering, men marknadsförhållandena kan ändras utan föregående meddelande.

Om författaren

Agne är en journalist som täcker de senaste trenderna och utvecklingen inom metaversen, AI och Web3 industrier för Metaverse Post. Hennes passion för berättande har lett till att hon har genomfört ett flertal intervjuer med experter inom dessa områden och alltid försökt avslöja spännande och engagerande berättelser. Agne har en kandidatexamen i litteratur och har en omfattande bakgrund i att skriva om ett brett spektrum av ämnen, inklusive resor, konst och kultur. Hon har också varit volontär som redaktör för djurrättsorganisationen, där hon hjälpt till att öka medvetenheten om djurskyddsfrågor. Kontakta henne på [e-postskyddad].

fler artiklar
Agne Cimerman
Agne Cimerman

Agne är en journalist som täcker de senaste trenderna och utvecklingen inom metaversen, AI och Web3 industrier för Metaverse Post. Hennes passion för berättande har lett till att hon har genomfört ett flertal intervjuer med experter inom dessa områden och alltid försökt avslöja spännande och engagerande berättelser. Agne har en kandidatexamen i litteratur och har en omfattande bakgrund i att skriva om ett brett spektrum av ämnen, inklusive resor, konst och kultur. Hon har också varit volontär som redaktör för djurrättsorganisationen, där hon hjälpt till att öka medvetenheten om djurskyddsfrågor. Kontakta henne på [e-postskyddad].

Institutionell aptit växer mot Bitcoin ETFs mitt i volatilitet

Avslöjande genom 13F-anmälningar avslöjar anmärkningsvärda institutionella investerare som sysslar med Bitcoin ETF:er, vilket understryker en växande acceptans av ...

Lär dig mer

Straffdagen anländer: CZ:s öde hänger i balans när den amerikanska domstolen överväger DOJ:s vädjande

Changpeng Zhao är redo att dömas i en amerikansk domstol i Seattle i dag.

Lär dig mer
Gå med i vår innovativa teknikgemenskap
Läs mer
Läs mer
Injective går samman med AltLayer för att ge inEVM återupptagande säkerhet
Företag Nyhetsrapport Teknologi
Injective går samman med AltLayer för att ge inEVM återupptagande säkerhet
Maj 3, 2024
Masa samarbetar med Teller för att introducera MASA Lending Pool, möjliggör USDC-lån på basen
Marknader Nyhetsrapport Teknologi
Masa samarbetar med Teller för att introducera MASA Lending Pool, möjliggör USDC-lån på basen
Maj 3, 2024
Velodrome lanserar Superchain Beta-version under de kommande veckorna och expanderar över OP Stack Layer 2 Blockchains
Marknader Nyhetsrapport Teknologi
Velodrome lanserar Superchain Beta-version under de kommande veckorna och expanderar över OP Stack Layer 2 Blockchains
Maj 3, 2024
CARV tillkännager partnerskap med Aethir för att decentralisera sitt datalager och dela ut belöningar
Företag Nyhetsrapport Teknologi
CARV tillkännager partnerskap med Aethir för att decentralisera sitt datalager och dela ut belöningar
Maj 3, 2024