Interview Kunst SMW
Maj 01, 2023

DeepFloyd and Beyond: Udforsk det seneste inden for AI-kunst med NightCafe Studios CEO

Kort sagt

Under et eksklusivt interview gav direktøren for NightCafe Studio værdifuld indsigt og perspektiver på AI-genereret kunst.

Angus Russell introducerede DeepFloyd – en ny algoritme udviklet af NightCafe Studios partner, Stability AI, der opererer i pixelrum og bruger en Large Language Model (LLM) til at generere billeder.

NightCafe Studio er en AI Art Generator, der giver brugerne mulighed for at skabe fantastisk og futuristisk kunst på få sekunder ved hjælp af kunstig intelligens. Grundlagt af Angus Russell For fire år siden blev NightCafe Studio født ud af Angus' egen frustration over ikke at kunne finde kunstværker, der gav genklang hos ham. Drevet af viden om, at stiloverførselsalgoritmer eksisterede, søgte han efter et websted, der ville gøre ham i stand til at skabe personlig kunst gennem stiloverførsel og udskrive den. 

Til sin skuffelse kunne han ikke finde sådan en platform. Men dette tilbageslag udløste en innovativ idé hos ham. Han besluttede at skabe en neural stiloverførselsapp til at skabe AI-genereret kunst, og han satte den op på Reddit.

NightCafe Studio opstod som en tekst-til-billede-genereringsplatform, hvilket gør den til den første af sin slags. Denne unikke funktion medførte en betydelig stigning i både omsætning og brugerbase. Siden da er platformen forblevet på forkant med generativ kunstig intelligens og har tiltrukket et stort fællesskab af entusiaster, der glæder sig over at bruge generatoren til at skabe fantastiske kunstværker. I dag betragtes NightCafe Studio bredt som en af ​​de mest populære og innovative AI-billedgeneratorer, der findes.

Under et interview med Angus Russell undersøgte vi fordelene og begrænsningerne ved AI-genereret kunst, den stigende brug af kunstig intelligens i kunstverdenen og den seneste AI-billedgenereringsalgoritme, DeepFloyd.

natcafe studie
Sydney Opera House: Et af Angus' første AI-genererede billeder

Fremkomsten af ​​AI-genereret kunst

I det sidste årti har kunstindustrien været vidne til en gradvis infiltration af kunstig intelligens og maskinlæring (ML). Disse banebrydende teknologier har introduceret nogle fascinerende nye koncepter, såsom Deepfakes og DALL-E, som har fået stor opmærksomhed over hele kloden. I dag har kunstindustrien ikke råd til at ignorere den enorme virkning af AI, som nu udløser en længe ventet revolution i sektoren.

Angus diskuterede, hvordan NightCafe Studio oplevede stigninger i væksten under udgivelsen af Stable Diffusion, en tekst-til-billede-model, som hans firma gik live med på lanceringsdagen. Siden da er adgangsbarrieren for at skabe lignende værktøjer blevet sænket på grund af open-sourcing af algoritmer og eksempelkoder.

NightCafe Studios grundlægger mener, at skabelse af kunstig intelligens ikke kun handler om slutproduktet, men også om processen med at skabe det. Han ser det som en form for terapi og afslapning, der giver folk mulighed for at udtrykke sig på unikke og kreative måder. Mange mennesker, der aldrig havde betragtet sig selv som kreative, har opdaget deres kunstneriske evner gennem AI-genererede billeder. Denne filosofi afspejles i platformens brugergrænseflade, som er designet til at være brugervenlig og tilgængelig for kunstnere på alle færdighedsniveauer. 

Alene på NightCafe Studio er der allerede mellem to og tre millioner brugere om måneden, hvilket genererer omkring en million billeder om dagen. Stability AI, en open source generativ AI-virksomhed, erklærede at de havde over 10 millioner brugere, der var aktive dagligt kort efter lanceringen af Stable Diffusion.

Anbefalet: 10+ bedste AI-kunstgeneratorer i 2023: Midjourney, DALL-E, NightCafe, Artbreeder

DeepFloyd IF: The New Game-Changing AI Image Generation Algorithm

NightCafe Studio implementerer en ny algoritme af Stability AI kaldet DeepFloyd, som lover at revolutionere, hvordan vi genererer billeder med kunstig intelligens.

DeepFloyd, som i øjeblikket er i beta, er en ny tekst-til-billede-model, der kan generere imponerende billeder fra naturlige sprogbeskrivelser. Den er baseret på en ny arkitektur, der kombinerer en stor sprogmodel med tre spredningsmodeller. Den er inspireret af Imagen, en lignende model udviklet af Google Research, men aldrig udgivet til offentligheden.

Modellen kan generere klare og sammenhængende billeder med tekst og objekter i forskellige rumlige relationer, hvilket er en udfordrende opgave for de fleste andre tekst-til-billede-modeller. Dette opnås ved at bruge den store sprogmodel T5-XXL-1.1 som tekstkoder og en betydelig mængde tekst-billede krydsopmærksomhedslag, der giver bedre prompt og billedalliance. 

DeepFloyd kan også skabe billeder med et ikke-standard formatforhold og har en høj grad af fotorealisme. Derudover giver det mulighed for nul-shot billede-til-billede oversættelser, hvilket betyder, at stilen, mønstrene og detaljerne i et outputbillede kan ændres, mens den grundlæggende form af kildebilledet bevares uden behov for finjustering.

Den nye algoritme fungerer på en anden måde end Stable Diffusion. DeepFloyd bruger pixelplads og en stor sprogmodel (LLM), hvorimod Stable Diffusion bruger latent rum og en fast CLIP-model. DeepFloyd bruger også flere diffusionsprocesser til at skabe billeder, mens Stable Diffusion bruger kun en enkelt.

DeepFloyd er navnet på den forskergruppe, der har bygget algoritmen, og selve algoritmen hedder IF. Forskergruppen omfatter mange af de samme mennesker, der har skabt GPT-3s forgænger, GPT-2, og en tidligere state-of-the-art sprogmodel kaldet RuGPT.

Nogle spekulationer tyder på, at navnet IF kan være inspireret af en Pink Floyd-sang af samme navn, som antydet af algoritmeforskningsgruppens bios på sociale medier.

Læs mere om algoritmen link..

deepfloyd natcafe studie
Billeder genereret med DeepFloyd IF. Kilde: Stability AI

Sammenligning af AI-kunstbegrænsninger og digital kunst

En af de største AI-begrænsninger er tekst, selvom DeepFloyd tackler dette problem. En anden begrænsning er vanskeligheden ved at få et billede nøjagtigt som forventet, især uden ekspertopfordring. AI mangler også evnen til at forstå og fortolke kulturelle og sociale sammenhænge, ​​der former menneskelig kunst. Derfor kan AI-genereret kunst nogle gange producere værker, der virker malplacerede eller kulturelt ufølsomme.

AI-genererede billeder kan dog stadig være smukke og til tider endda bedre end den oprindelige idé, så længe brugeren er åben for at blive overrasket, sagde Angus. Desuden er der måder at ændre på genererede billeder ved hjælp af AI-algoritmer eller Photoshop. Selvom det i øjeblikket er et område for aktiv forskning at få et nøjagtigt billede, sker der betydelige fremskridt. Det kan snart være muligt at have fuld kontrol over alle aspekter af et billede. 

AI er afhængig af de billeder og kunst, der findes på nettet, som inspiration, men kun dem, den er trænet på. Forskellige algoritmer, som f.eks Midjourney, DALL-E og Stable Diffusion, er trænet i forskellige datasæt, hvilket betyder, at de kan præstere bedre på bestemte typer billeder. 

For nylig har forskere undersøgt virkningen af ​​at fjerne billeder af lav kvalitet fra træningsdatasæt for at forbedre AI-resultater. Ved at bortfiltrere disse lavkvalitetsbilleder kan det resulterende datasæt blive mindre, men højere kvalitet, hvilket fører til bedre resultater uden at øge størrelsen på AI-modeller eller kræve dyrere hardware. Angus delte, at denne tilgang repræsenterer en lovende måde at forbedre kvaliteten af ​​AI-genererede billeder uden at stole på større og mere ressourcekrævende modeller.

Et problem med AI i kunst er, at det kan devaluere menneskelige kunstneres arbejde, som bruger meget tid på at skabe kunst, mens AI er i stand til at generere kunst i løbet af få sekunder. Der er dog en vis immateriel kvalitet ved menneskelig kunst, som kan være vanskelig for AI at replikere, såsom den følelsesmæssige dybde og kompleksitet, der ofte er til stede i menneskeskabte værker. NightCafe Studio mener, at AI handler mindre om at skabe kunst til kommercielle formål og mere om nydelsen af ​​selve den kreative proces.

"Der vil altid være værdi i menneskeskabt kunst, fordi den repræsenterer kunstnerens indsats og dygtighed, hvorimod AI-genereret kunst ikke har den samme iboende værdi."

Sagde Angus.

Et etisk problem omkring AI i kunst er brugen af ​​offentlige billeder til at træne AI-algoritmer, som muligvis ikke tilhører den virksomhed, der træner AI'en. Selvom der i øjeblikket ikke er nogen love, der er brudt, rejser det spørgsmål om samtykke og privatliv. Open source virksomheder som OpenAI og DALL-E arbejder på at gøre processen mere etisk, men det er fortsat et åbent spørgsmål. Der kan komme fremtidige regler vedrørende brugen af ​​billeder til at træne AI i kunst.

På trods af disse bekymringer mener Angus, at AI-processen i kunst ikke er fundamentalt forskellig fra menneskelige kunstnere, der henter inspiration fra andre kunstneres arbejde. AI ved, hvordan tingene ser ud og husker stykker om billeder, ligesom mennesker gør. Det er simpelthen bedre til at genskabe dem fra bunden.

Læs mere:

Ansvarsfraskrivelse

I tråd med den Trust Project retningslinjer, bemærk venligst, at oplysningerne på denne side ikke er beregnet til at være og ikke skal fortolkes som juridiske, skattemæssige, investeringsmæssige, finansielle eller nogen anden form for rådgivning. Det er vigtigt kun at investere, hvad du har råd til at tabe, og at søge uafhængig finansiel rådgivning, hvis du er i tvivl. For yderligere information foreslår vi at henvise til vilkårene og betingelserne samt hjælpe- og supportsiderne fra udstederen eller annoncøren. MetaversePost er forpligtet til nøjagtig, objektiv rapportering, men markedsforholdene kan ændres uden varsel.

Om forfatteren

Agne er en journalist, der dækker de seneste trends og udviklinger inden for metaverset, AI og Web3 industrier for Metaverse Post. Hendes passion for historiefortælling har fået hende til at gennemføre adskillige interviews med eksperter inden for disse områder, hvor hun altid søger at afdække spændende og engagerende historier. Agne er uddannet bachelor i litteratur og har en omfattende baggrund i at skrive om en bred vifte af emner, herunder rejser, kunst og kultur. Hun har også været frivillig som redaktør for dyrerettighedsorganisationen, hvor hun var med til at skabe opmærksomhed omkring dyrevelfærdsspørgsmål. Kontakt hende på [e-mail beskyttet].

Flere artikler
Agne Cimerman
Agne Cimerman

Agne er en journalist, der dækker de seneste trends og udviklinger inden for metaverset, AI og Web3 industrier for Metaverse Post. Hendes passion for historiefortælling har fået hende til at gennemføre adskillige interviews med eksperter inden for disse områder, hvor hun altid søger at afdække spændende og engagerende historier. Agne er uddannet bachelor i litteratur og har en omfattende baggrund i at skrive om en bred vifte af emner, herunder rejser, kunst og kultur. Hun har også været frivillig som redaktør for dyrerettighedsorganisationen, hvor hun var med til at skabe opmærksomhed omkring dyrevelfærdsspørgsmål. Kontakt hende på [e-mail beskyttet].

Hot Stories
Tilmeld dig vores nyhedsbrev.
Seneste Nyheder

Institutionel appetit vokser mod Bitcoin ETF'er midt i volatilitet

Afsløringer gennem 13F-arkivering afslører bemærkelsesværdige institutionelle investorer, der dytter i Bitcoin ETF'er, hvilket understreger en voksende accept af ...

Vide mere

Straffeudmålingsdagen ankommer: CZ's skæbne hænger i balance, da amerikansk domstol overvejer DOJ's anbringende

Changpeng Zhao står klar til at blive dømt ved en amerikansk domstol i Seattle i dag.

Vide mere
Tilmeld dig vores innovative teknologifællesskab
Læs mere
Læs mere
Injective slår sig sammen med AltLayer for at give inEVM genskabende sikkerhed
Forretning Nyheds rapport Teknologier
Injective slår sig sammen med AltLayer for at give inEVM genskabende sikkerhed
Maj 3, 2024
Masa går sammen med Teller for at introducere MASA Lending Pool, muliggør USDC-lån på base
Markeder Nyheds rapport Teknologier
Masa går sammen med Teller for at introducere MASA Lending Pool, muliggør USDC-lån på base
Maj 3, 2024
Velodrome lancerer Superchain Beta-version i de kommende uger og udvider på tværs af OP Stack Layer 2 Blockchains
Markeder Nyheds rapport Teknologier
Velodrome lancerer Superchain Beta-version i de kommende uger og udvider på tværs af OP Stack Layer 2 Blockchains
Maj 3, 2024
CARV annoncerer partnerskab med Aethir for at decentralisere sit datalag og uddele belønninger
Forretning Nyheds rapport Teknologier
CARV annoncerer partnerskab med Aethir for at decentralisere sit datalag og uddele belønninger
Maj 3, 2024