Nyheds rapport Teknologier
September 21, 2023

DALL-E 3 Release forstærker OpenAI's Indflydelse, Forlader Midjourney og Stable Diffusion Bag

Kort sagt

DALL-E 3 er indstillet til at være problemfrit integreret med GPT-4, specielt skræddersyet til ChatGPT+ abonnenter.

DALL-E 3 afholder sig fra at genskabe billeder af offentlige personer, når deres navne udtrykkeligt er nævnt.

Tidslinjen for adgang til DALL-E 3 er sat til oktober.

OpenAI har afsløret sin seneste kreation: DALL-E3. I modsætning til sine forgængere fokuserer DALL-E 3 på at forfine detaljerne ved at løse problemer som bogstaver og indviklede kropsdetaljer, såsom fingre. Resultatet? En række æstetisk tiltalende billeder uden behov for komplekse prompter eller løsninger.

DALL-E 3 Release forstærker OpenAI's indflydelse, forlader Midjourney og Stable Diffusion Bag

Det er vigtigt at bemærke, at denne udgivelse ikke kommer med et omfattende sæt implementeringsdetaljer, artikler eller API'er. I stedet er DALL-E 3 indstillet til at være problemfrit integreret med GPT-4, specielt skræddersyet til ChatGPT+ abonnenter.

Denne udvikling er måske ikke et seismisk skift i AI-landskabet, men snarere et skridt fremad i samarbejde mellem modeller. Mange forventer det næste Stable Diffusion model vil tilbyde endnu større sofistikering og kunstnerisk appel.

For at sætte det i en sammenhæng, OpenAIs rejse gennem AI-billedgenerering har været noget af en tur:

  • 2021: DALL-E 1, en 12-milliard parametermodel, blev introduceret med begrænset information.
  • 2021: GLIDE, en 2-milliard parametermodel, blev afsløret sammen med open source 300-millioner parametermodeller.
  • 2022: DALL-E 2 ankom, med 2 milliarder parametre, ledsaget af et unCLIP-papir og API.
  • 2023: DALL-E 3 har gjort sit indtog, og selvom detaljerne måske er noget kryptiske, er én ting klar – den vil integreres med GPT-4 forum ChatGPT+ abonnenter.

Lige nu er billederne af DALL-E 3 stadig lidt sparsomme. Der er ingen kodebase, blogindlæg eller detaljeret sammenligning med det nyeste (SOTA). OpenAI ser ud til at holde deres kort tæt til brystet.

DALL-E 3 Release forstærker OpenAI's indflydelse, forlader Midjourney og Stable Diffusion Bag

Modellen er udråbt til at have en dybere forståelse af nuancer og detaljer sammenlignet med dens forgængere. Det betyder, at oversættelse af dine kreative koncepter til meget præcise billeder forventes at være en mere smidig proces.

Et spændende løfte om DALL-E 3 er dens integration med ChatGPT. Dette indebærer, at brugere ikke behøver at kæmpe med at lave indviklede prompter; en kort beskrivelse burde være tilstrækkelig, med ChatGPT dygtigt at generere detaljerede prompter på dine vegne.

OpenAI har også understreget betydningen af ​​kontekst i lange opfordringer. DALL-E 3 er designet til at omfavne detaljering, hvilket gør den mere tilpasset den kontekst, der er beskrevet i omfattende prompter.

Alligevel, som med enhver ny AI-model, er der et element af det ukendte. Mens de første glimt ser lovende ud, vil den sande lakmustest komme med udvidet brug. Spørgsmål dvæler om dens effektivitet og hastighed.

Det er sandsynligt, at DALL-E 3 vil være en flertrins diffusionsproces, med GPT-4 fungerer som tekstkoder. Den indviklede mekanik i denne opsætning kan forblive indhyllet i hemmeligholdelse.

Tidslinjen for adgang til DALL-E 3 er sat til oktober, i første omgang for ChatGPT Plus og ChatGPT Enterprise brugers, med mulighed for bredere adgang for forskere herefter.

Relaterede: OpenAI's Altman ved det amerikanske senat for at diskutere risici ved kunstig intelligens

Nuancer og Censur af DALL-E 3

De primære omdrejningspunkter for DALL-E 3's udvikling var den omhyggelige proces med at begrænse dens muligheder. Dette involverede stringent justering og filtre designet til at udelukke specifikke typer indhold. For eksempel nægter modellen på det kraftigste at generere billeder af berømte personligheder, kopiere kunstværker i stil med kendte kunstnere eller skabe noget indhold, der anses for usikkert af OpenAIs kræsne standarder. Denne strategiske tilgang handler ikke kun om begrænsninger; det er en proaktiv foranstaltning, der har til formål at beskytte virksomheden mod potentielle juridiske forviklinger.

Men ud over disse filtre og justeringer kommer nogle spændende observationer frem. DALL-E 3 ser ud til at udvise en vis svaghed, når det kommer til at generere fotorealistisk indhold. I stedet for at producere billeder, der efterligner rigtige fotografier fejlfrit, har outputtet en tydelig stiliseret kvalitet. Disse AI-lavede billeder udstråler et næsten gengivet og let plastisk udseende. Selv når det udtrykkeligt bliver bedt om med ordet "fotografi", forbliver resultatet forankret i sin karakteristiske stilisering.

Spørg #1
Spørg #1: Nærbillede af en eremitkrebs beliggende i vådt sand, med havskum i nærheden og detaljerne i dens skal og tekstur af sandet fremhævet.
Spørg #2
Spørg #2: En levende gul bananformet sofa sidder i en hyggelig stue, dens kurve vugger en bunke farverige puder. på trægulvet tilføjer et mønstret tæppe et strejf af eklektisk charme, og en potteplante sidder i hjørnet og rækker ud mod sollyset, der filtrerer gennem vinduet.
Spørg #3
Prompt #3: Et foto af et gammelt skibsvrag beliggende på havbunden. Marineplanter har gjort krav på træstrukturen, og fisk svømmer ind og ud af dens hulrum. Sunne skatte og gamle kanoner er spredt rundt og giver et indblik i fortiden.

Det er værd at bemærke, at på trods af disse idiosynkrasier giver DALL-E 3 et glimt af bemærkelsesværdigt potentiale. Blandt dets kreationer udviser nogle forekomster en slående lighed med fotografier. For at huske på, at den simulerede realisme af disse billeder ikke nødvendigvis stemmer overens med, hvordan et ægte fotografi af det samme motiv ville se ud, især hvis det er nedsænket under vandet.

Relaterede: Microsoft afslørede Designer, det første professionelle tekst-til-billede-værktøj baseret på DALL-E 2

DALL-E 3 funktioner og detaljer

Lad os tage et øjeblik på at gennemse pixels og læse mellem linjerne for at forstå, hvad denne nye model virkelig tilbyder.

Stiliseringens kunst: Kigger igennem OpenAIsin Instagram-konto, vil du bemærke en overflod af kunstværker præget af udsøgt stilisering. Selvom der er et imponerende udvalg af abstrakte kompositioner og designs, ser modellen ud til at undgå at producere fotorealistisk indhold. Vægten her er på æstetik og kreativitet, ikke at efterligne virkeligheden.

Kunstneriske begrænsninger: DALL-E 3 tager en anden vej end sin forgænger. Den nægter på det kraftigste at skabe billeder i stil med levende kunstnere, en markant afvigelse fra DALL-E 2, som kunne efterligne visse kunstneres stilarter. Dette kan hæve øjenbrynene i det kreative fællesskab, svarende til den lunkne modtagelse af Stable Diffusion 2.0.

Styrkende kunstnere: I et træk for at respektere kunstneres rettigheder, OpenAI giver kunstnere mulighed for at udelukke deres arbejde fra fremtidige DALL-E-versioner. Ved at indsende et billede, de ejer rettighederne til, kan kunstnere anmode om dets udelukkelse fra modellens output. Fremtidige iterationer af DALL-E vil så undgå at generere indhold, der ligner kunstnerens stil.

Sikkerhed og censur: OpenAIs paranoia om sikkerhed er til at tage og føle på. De har samarbejdet med eksterne "røde teams" for at teste modellens sikkerhed og brugt inputklassifikatorer til at lære modellen at ignorere specifikke ord, der kunne føre til eksplicit eller skadeligt indhold. DALL-E 3 afholder sig fra at genskabe billeder af offentlige personer når deres navne udtrykkeligt er nævnt. Hvorvidt berømtheder falder ind under denne kategori er fortsat usikkert, hvilket potentielt påvirker kvaliteten af ​​genererede ansigter.

Vandmærker og sporing: Der er et hint om indlejring af tags for at spore "AI-genererede billeder", hvilket indikerer et skridt mod bedre overvågning og potentielt vandmærkegenereret indhold.

Tekst og hænder forbedret: OpenAI fremhæver forbedret tekstgenerering og håndgengivelse, en almindelig påstand blandt konkurrenter. Den virkelige test ligger i det faktiske output ud over kirsebærplukkede eksempler.

Rumlig forståelse: DALL-E 3 udmærker sig ved at forstå rumlige forhold beskrevet i prompter. Dette forbedrer modellens evne til at konstruere komplekse vinkler og kompositioner, selvom brugerne afventer mere konkret bevis på dette løfte.

Styrken ved tilskyndelser: Kernen i DALL-E3 ligger i dens hurtige kapaciteter og integration med ChatGPT. Det lover automatisering, hastighed og forenkling af hurtigt design. Tendensen her går i retning af chatGPT generere prompter, der oversætter vage ideer eller rudimentære opfordringer til veltalende. DALL-E 3's forbedrede kontekstuelle forståelse strømliner processen, hvilket giver brugerne mulighed for at fokusere på hensigt frem for ordlyd.

Ukendte territorier: Særligt fraværende i diskussionen er aspekter som indpainting, outpainting, generativ fyldning og 3D-modellering. Fraværet af disse funktioner kan være en begrænsning, især for brugere, der er vant til mere alsidige modeller.

Adgangsdetaljer: DALL-E 3 er indstillet til at blive tilgængelig for ChatGPT Plus- og Enterprise-kunder i begyndelsen af ​​oktober. Men de nærmere detaljer vedrørende tildeling af kreditter for ChatGPT Plus-brugere og de tilhørende omkostninger forbliver uklare. Adgang vil blive givet via API'et og OpenAI Labs platform "senere på efteråret."

Integrationsevne: DALL-E er indstillet til at blive problemfrit integreret i partner- og Microsoft-produkter. Forvent at være vidne til genereringen af ​​præsentationer, illustrationer, designs, logoer, alt sammen i sammenhæng og forstærket med assistance fra ChatGPT. Denne integration er klar til at blive mainstream, hvilket udgør en betydelig udfordring for konkurrenter som Google med sin Bard og ideogram.

Konvergensen af ​​LLM og visuelt indhold: Det mest spændende aspekt ligger i konvergensen af ​​store sprogmodeller (LLM'er) og modeller for generering af visuelt indhold. Det betyder et skift fra kompleks prompt engineering til at udtrykke ideer i et mere tilgængeligt sprog. AI'en vil hente kontekst og ideer fra disse udtryk og tilbyde kreative muligheder, som er svære at modstå.

Relaterede: Top 50 tekst-til-billede-prompter til AI-kunstgeneratorer Midjourney og DALL-E

DALL-E 3: Bliv en ny leder i AI Image Generation

OpenAI's beslutning om at integrere DALL-E 3 i ChatGPT økosystemet er et strategisk træk. Denne integration giver DALL-E 3 adgang til en enorm brugerdatabase på 100 millioner aktive brugere. Dette trin forbedrer DALL-E 3s tilgængelighed markant og har potentialet til at slynge dens popularitet.

Dag, Midjourney og Stable Diffusion prale rundt 15 millioner registrerede brugere. Men med denne integration er DALL-E 3 indstillet til at få adgang til en brugerbase, der er ti gange større - 100 millioner brugere. Dette gør ChatGPT Plus abonnement planlægge endnu mere tiltalende, da det giver adgang til en chatbot, analytiske værktøjer og billedgenerering, alt sammen til en overkommelig pris.

Integrationen er ikke kun fordelagtig for eksisterende brugere, men fungerer også som en kraftfuld magnet for nye brugere. Det udvider OpenAI økosystemets rækkevidde og popularitet, der tiltrækker personer, der søger AI-genererede indholdsløsninger.

Dette strategiske træk er klar til at booste OpenAI's omsætning og andre nøglemålinger. Selskabets investorer vil sandsynligvis se denne udvikling positivt, især i lyset af en nylig 20% fald i trafikmængden i løbet af sommeren.

DALL-E 3 Release forstærker OpenAI's Indflydelse, Forlader Midjourney og Stable Diffusion Bag
ChatGPT Webtrafik falder 20 % i september og fortsætter med at falde

Læs flere relaterede emner:

Ansvarsfraskrivelse

I tråd med den Trust Project retningslinjer, bemærk venligst, at oplysningerne på denne side ikke er beregnet til at være og ikke skal fortolkes som juridiske, skattemæssige, investeringsmæssige, finansielle eller nogen anden form for rådgivning. Det er vigtigt kun at investere, hvad du har råd til at tabe, og at søge uafhængig finansiel rådgivning, hvis du er i tvivl. For yderligere information foreslår vi at henvise til vilkårene og betingelserne samt hjælpe- og supportsiderne fra udstederen eller annoncøren. MetaversePost er forpligtet til nøjagtig, objektiv rapportering, men markedsforholdene kan ændres uden varsel.

Om forfatteren

Damir er teamleder, produktchef og redaktør på Metaverse Post, der dækker emner som AI/ML, AGI, LLM'er, Metaverse og Web3-relaterede felter. Hans artikler tiltrækker et massivt publikum på over en million brugere hver måned. Han ser ud til at være en ekspert med 10 års erfaring i SEO og digital markedsføring. Damir er blevet nævnt i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto og andre publikationer. Han rejser mellem UAE, Tyrkiet, Rusland og SNG som en digital nomade. Damir tog en bachelorgrad i fysik, som han mener har givet ham de kritiske tænkningskompetencer, der er nødvendige for at få succes i internettets evigt skiftende landskab. 

Flere artikler
Damir Yalalov
Damir Yalalov

Damir er teamleder, produktchef og redaktør på Metaverse Post, der dækker emner som AI/ML, AGI, LLM'er, Metaverse og Web3-relaterede felter. Hans artikler tiltrækker et massivt publikum på over en million brugere hver måned. Han ser ud til at være en ekspert med 10 års erfaring i SEO og digital markedsføring. Damir er blevet nævnt i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto og andre publikationer. Han rejser mellem UAE, Tyrkiet, Rusland og SNG som en digital nomade. Damir tog en bachelorgrad i fysik, som han mener har givet ham de kritiske tænkningskompetencer, der er nødvendige for at få succes i internettets evigt skiftende landskab. 

Hot Stories
Tilmeld dig vores nyhedsbrev.
Seneste Nyheder

Stilheden før Solana-stormen: Hvad diagrammer, hvaler og signaler på kæden siger nu

Solana har vist stærke resultater, drevet af stigende implementering, institutionel interesse og vigtige partnerskaber, samtidig med at den står over for potentielle ...

Vide mere

Krypto i april 2025: Vigtigste tendenser, ændringer og hvad der kommer bagefter

I april 2025 fokuserede kryptomarkedet på at styrke kerneinfrastrukturen, hvor Ethereum forberedte sig på Pectra ...

Vide mere
Læs mere
Læs mere
Bitget åbner IPO Prime for abonnement og udvider adgangen til muligheder før børsnotering
Nyheds rapport Teknologier
Bitget åbner IPO Prime for abonnement og udvider adgangen til muligheder før børsnotering
April 20, 2026
AI-agenter forbedres hurtigt, men kæmper stadig med at fungere i den virkelige verden
Nyheds rapport Teknologier
AI-agenter forbedres hurtigt, men kæmper stadig med at fungere i den virkelige verden
April 20, 2026
Inde i Hack Seasons-konferencen i Cannes: Kampen om stablecoins, da den nye finansielle jernbane allerede er begyndt
Hack sæsoner Interview Forretning Lifestyle Teknologier
Inde i Hack Seasons-konferencen i Cannes: Kampen om stablecoins, da den nye finansielle jernbane allerede er begyndt
April 20, 2026
Hong Kong SFC lancerer pilotramme for sekundær handel med tokeniserede investeringsprodukter på licenserede platforme
Forretning Nyheds rapport Teknologier
Hong Kong SFC lancerer pilotramme for sekundær handel med tokeniserede investeringsprodukter på licenserede platforme
April 20, 2026