DALL-E 3 Release versterkt OpenAI's Invloed, vertrek Midjourney en Stable Diffusion achter
In het kort
DALL-E 3 zal naadloos worden geïntegreerd met GPT-4, speciaal op maat gemaakt ChatGPT+ abonnees.
DALL-E 3 onthoudt zich van het opnieuw creëren van afbeeldingen van publieke figuren wanneer hun namen expliciet worden vermeld.
De tijdlijn voor toegang tot DALL-E 3 is vastgesteld op oktober.
OpenAI heeft zijn nieuwste creatie onthuld: DALL-E3. In tegenstelling tot zijn voorgangers richt DALL-E 3 zich op het verfijnen van de details, waarbij zaken als letters en ingewikkelde lichaamsdetails, zoals vingers, worden aangepakt. Het resultaat? Een reeks esthetisch aantrekkelijke afbeeldingen zonder de noodzaak van complexe aanwijzingen of oplossingen.
Het is belangrijk op te merken dat deze release niet wordt geleverd met een uitgebreide set implementatiedetails, artikelen of API's. In plaats daarvan zal DALL-E 3 naadloos worden geïntegreerd met GPT-4, speciaal op maat gemaakt ChatGPT+ abonnees.
Deze ontwikkeling is misschien geen seismische verschuiving in het AI-landschap, maar eerder een stap voorwaarts in de samenwerking tussen modellen. Velen verwachten dat de volgende Stable Diffusion model zal een nog grotere verfijning en artistieke aantrekkingskracht bieden.
Om het in context te plaatsen, OpenAI's reis door het genereren van AI-beelden was een hele rit:
- 2021: DALL-E 1, een model met 12 miljard parameters, werd geïntroduceerd met beperkte informatie.
- 2021: GLIDE, een parametermodel van 2 miljard, werd onthuld samen met open-source parametermodellen van 300 miljoen.
- 2022: DALL-E 2 arriveerde, met 2 miljard parameters, vergezeld van een unCLIP-papier en API.
- 2023: DALL-E 3 heeft zijn intrede gedaan en hoewel de details misschien wat cryptisch zijn, is één ding duidelijk: het zal integreren met GPT-4 besteld, ChatGPT+ abonnees.
Vanaf nu blijven beelden van DALL-E 3 enigszins schaars. Er is geen codebase, blogpost of gedetailleerde vergelijking met de state-of-the-art (SOTA). OpenAI Het lijkt erop dat ze hun kaarten dicht bij hun borst houden.

Er wordt aangeprezen dat het model een dieper begrip van nuances en details bezit in vergelijking met zijn voorgangers. Dit betekent dat het naar verwachting een soepeler proces zal zijn om uw creatieve concepten te vertalen naar zeer nauwkeurige beelden.
Een intrigerende belofte van DALL-E 3 is de integratie ervan met ChatGPT. Dit houdt in dat gebruikers niet hoeven te worstelen met het maken van ingewikkelde aanwijzingen; een korte beschrijving zou moeten volstaan, met ChatGPT op bekwame wijze gedetailleerde aanwijzingen voor u genereren.
OpenAI heeft ook het belang van context in lange prompts benadrukt. DALL-E 3 is ontworpen om breedsprakigheid te omarmen, waardoor het beter aansluit bij de context die wordt beschreven in uitgebreide aanwijzingen.
Toch zit er, zoals bij elk nieuw AI-model, een element van het onbekende in. Hoewel de eerste glimpen veelbelovend lijken, zal de echte lakmoesproef bij langdurig gebruik komen. Er blijven vragen hangen over de efficiëntie en snelheid van werken.
Het is waarschijnlijk dat DALL-E 3 een meerfasig diffusieproces zal zijn GPT-4 fungeert als tekstencoder. De ingewikkelde mechanismen van deze opzet kunnen in geheimhouding gehuld blijven.
De tijdlijn voor toegang tot DALL-E 3 is in eerste instantie vastgesteld op oktober ChatGPT Plus en ChatGPT Enterprise-gebruikers, met een mogelijkheid van bredere toegang voor onderzoekers daarna.






nuances en Censuur van DALL-E 3
De belangrijkste aandachtspunten bij de ontwikkeling van DALL-E 3 waren het nauwgezette proces om de mogelijkheden ervan te beperken. Dit omvatte een strikte afstemming en filters die waren ontworpen om specifieke soorten inhoud uit te sluiten. Het model weigert bijvoorbeeld resoluut afbeeldingen van beroemde persoonlijkheden te genereren, kunstwerken te repliceren in de stijl van gerenommeerde kunstenaars, of inhoud te creëren die door de autoriteiten als onveilig wordt beschouwd. OpenAI's veeleisende normen. Deze strategische aanpak gaat niet alleen over beperkingen; het is een proactieve maatregel die erop gericht is het bedrijf te beschermen tegen mogelijke juridische verwikkelingen.
Maar buiten deze filters en uitlijningen komen er enkele intrigerende observaties aan het licht. DALL-E 3 lijkt een zekere zwakte te vertonen als het gaat om het genereren van fotorealistische inhoud. In plaats van afbeeldingen te produceren die echte foto's feilloos nabootsen, heeft de uitvoer een duidelijke gestileerde kwaliteit. Deze door AI vervaardigde afbeeldingen stralen een bijna weergegeven en enigszins plastic uiterlijk uit. Zelfs als er expliciet om wordt gevraagd met het woord ‘foto’, blijft het resultaat verankerd in zijn karakteristieke stilering.
Het is vermeldenswaard dat DALL-E 3, ondanks deze eigenaardigheden, een glimp van opmerkelijk potentieel biedt. Onder de creaties vertonen sommige exemplaren een opvallende gelijkenis met foto's. Houd er rekening mee dat het gesimuleerde realisme van deze afbeeldingen niet noodzakelijkerwijs overeenkomt met hoe een echte foto van hetzelfde onderwerp eruit zou zien, vooral als deze onder water zou worden ondergedompeld.
DALL-E 3-functies en details
Laten we even de tijd nemen om door de pixels te bladeren en tussen de regels door te lezen om te begrijpen wat dit nieuwe model werkelijk te bieden heeft.
De kunst van het stileren: Doorkijken OpenAI's Instagram-account, zul je een overvloed aan kunstwerken opmerken die worden gekenmerkt door een voortreffelijke stilering. Hoewel er een indrukwekkend scala aan abstracte composities en ontwerpen is, lijkt het model zich te onthouden van het produceren van fotorealistische inhoud. De nadruk ligt hier op esthetiek en creativiteit, niet op het nabootsen van de werkelijkheid.
Artistieke beperkingen: DALL-E 3 slaat een andere weg in dan zijn voorganger. Het weigert resoluut beelden te creëren in de stijl van levende kunstenaars, wat in sterke mate afwijkt van DALL-E 2, dat de stijlen van bepaalde kunstenaars zou kunnen imiteren. Dit zou in de creatieve gemeenschap de wenkbrauwen kunnen doen fronsen, vergelijkbaar met de lauwe ontvangst van Stable Diffusion 2.0.
Kunstenaars empoweren: In een poging om de rechten van kunstenaars te respecteren, OpenAI stelt kunstenaars in staat hun werk uit te sluiten van toekomstige DALL-E-versies. Door een afbeelding in te dienen waarvan zij de rechten bezitten, kunnen kunstenaars verzoeken dat deze wordt uitgesloten van de productie van het model. Toekomstige iteraties van DALL-E zullen dan voorkomen dat er inhoud wordt gegenereerd die lijkt op de stijl van de kunstenaar.
Veiligheid en censuur: OpenAI's paranoia over veiligheid is voelbaar. Ze hebben samengewerkt met externe 'rode teams' om de veiligheid van het model te testen en hebben invoerclassificatoren gebruikt om het model te leren specifieke woorden te negeren die tot expliciete of schadelijke inhoud zouden kunnen leiden. DALL-E 3 onthoudt zich van het opnieuw creëren van afbeeldingen van publieke figuren wanneer hun namen expliciet worden genoemd. Of beroemdheden onder deze categorie vallen, blijft onzeker, wat mogelijk invloed heeft op de kwaliteit van de gegenereerde gezichten.
Watermerken en tracking: Er is een hint naar het insluiten van tags om “AI-gegenereerde afbeeldingen” bij te houden, wat wijst op een stap in de richting van betere monitoring en mogelijk het voorzien van een watermerk van gegenereerde inhoud.
Tekst en wijzers verbeterd: OpenAI prijst verbeterde tekstgeneratie en handweergave aan, een veelgehoorde claim onder concurrenten. De echte test ligt in de daadwerkelijke output, afgezien van de geselecteerde voorbeelden.
Ruimtelijk begrip: DALL-E 3 blinkt uit in het begrijpen van ruimtelijke relaties beschreven in aanwijzingen. Dit vergroot het vermogen van het model om complexe hoeken en composities te construeren, hoewel gebruikers wachten op concreter bewijs van deze belofte.
De kracht van aanwijzingen: De kern van DALL-E3 ligt in zijn snelle mogelijkheden en integratie met ChatGPT. Het belooft automatisering, snelheid en vereenvoudiging van een snel ontwerp. De trend hier is in de richting van chatGPT het genereren van aanwijzingen, het vertalen van vage ideeën of rudimentaire aanwijzingen in welsprekende ideeën. Het verbeterde contextuele begrip van DALL-E 3 stroomlijnt het proces, waardoor gebruikers zich kunnen concentreren op de intentie in plaats van op de breedsprakigheid.
Onbekende gebieden: Opvallend afwezig in de discussie zijn aspecten als inpainting, outpainting, generatieve vulling en 3D-modellering. De afwezigheid van deze functies kan een beperking zijn, vooral voor gebruikers die gewend zijn aan veelzijdigere modellen.
Toegang tot details: DALL-E 3 is beschikbaar voor ChatGPT Plus- en Enterprise-klanten begin oktober. Echter, de details met betrekking tot de toewijzing van credits voor ChatGPT Plusgebruikers en de bijbehorende kosten blijven onduidelijk. Toegang wordt verleend via de API en de OpenAI Labs-platform “later in de herfst.”
Integratievermogen: DALL-E zal naadloos worden geïntegreerd in partner- en Microsoft-producten. Verwacht getuige te zijn van het genereren van presentaties, illustraties, ontwerpen, logo's, allemaal in context en versterkt met de hulp van ChatGPT. Deze integratie zal mainstream worden en een aanzienlijke uitdaging vormen voor concurrenten als de EU Google met zijn Bard en Ideogram.
De convergentie van LLM en visuele inhoud: Het meest intrigerende aspect ligt in de convergentie van grote taalmodellen (LLM's) en modellen voor het genereren van visuele inhoud. Het betekent een verschuiving van complexe snelle engineering naar het uitdrukken van ideeën in een meer toegankelijke taal. De AI zal context en ideeën uit deze uitingen halen en creatieve mogelijkheden bieden die moeilijk te weerstaan zijn.
DALL-E 3: Wees een nieuwe leider in de AI-beeldgeneratie
OpenAI's beslissing om DALL-E 3 te integreren in de ChatGPT ecosysteem is een strategische zet. Deze integratie geeft DALL-E 3 toegang tot een enorme gebruikersdatabase van 100 miljoen actieve gebruikers. Deze stap verbetert de toegankelijkheid van DALL-E 3 aanzienlijk en heeft het potentieel om zijn populariteit te katapulteren.
Momenteel Midjourney en Stable Diffusion opscheppen rond 15 miljoen geregistreerde gebruikers. Met deze integratie zal DALL-E 3 echter toegang krijgen tot een gebruikersbestand dat tien keer groter is: 100 miljoen gebruikers. Dit maakt de ChatGPT Plus abonnement plan des te aantrekkelijker, omdat het toegang biedt tot een chatbot, analytische hulpmiddelen en het genereren van afbeeldingen, alles tegen een betaalbare prijs.
De integratie is niet alleen voordelig voor bestaande gebruikers, maar dient ook als een krachtige magneet voor nieuwe gebruikers. Het breidt de OpenAI het bereik en de populariteit van het ecosysteem, waardoor individuen worden aangetrokken die op zoek zijn naar door AI gegenereerde inhoudsoplossingen.
Deze strategische zet staat op het punt een impuls te krijgen OpenAI's omzet en andere belangrijke statistieken. De investeerders van het bedrijf zullen deze ontwikkeling waarschijnlijk positief beoordelen, vooral in het licht van de recente ontwikkelingen 20% daling van het verkeersvolume gedurende de zomer.
Lees meer gerelateerde onderwerpen:
Disclaimer
In lijn met de Richtlijnen voor vertrouwensprojectenHoud er rekening mee dat de informatie op deze pagina niet bedoeld is en niet mag worden geïnterpreteerd als juridisch, fiscaal, beleggings-, financieel of enige andere vorm van advies. Het is belangrijk om alleen te beleggen wat u zich kunt veroorloven te verliezen en onafhankelijk financieel advies in te winnen als u twijfels heeft. Voor meer informatie raden wij u aan de algemene voorwaarden en de hulp- en ondersteuningspagina's van de uitgever of adverteerder te raadplegen. MetaversePost streeft naar nauwkeurige, onpartijdige berichtgeving, maar de marktomstandigheden kunnen zonder voorafgaande kennisgeving worden gewijzigd.
Over de auteur
Damir is de teamleider, productmanager en redacteur bij Metaverse Post, met onderwerpen als AI/ML, AGI, LLM's, Metaverse en Web3-gerelateerde velden. Zijn artikelen trekken maandelijks een enorm publiek van meer dan een miljoen gebruikers. Hij blijkt een expert te zijn met 10 jaar ervaring in SEO en digitale marketing. Damir is genoemd in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto en andere publicaties. Hij reist als digitale nomade tussen de VAE, Turkije, Rusland en het GOS. Damir behaalde een bachelordiploma in natuurkunde, wat hem volgens hem de kritische denkvaardigheden heeft gegeven die nodig zijn om succesvol te zijn in het steeds veranderende landschap van internet.
Meer artikelen
Damir is de teamleider, productmanager en redacteur bij Metaverse Post, met onderwerpen als AI/ML, AGI, LLM's, Metaverse en Web3-gerelateerde velden. Zijn artikelen trekken maandelijks een enorm publiek van meer dan een miljoen gebruikers. Hij blijkt een expert te zijn met 10 jaar ervaring in SEO en digitale marketing. Damir is genoemd in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto en andere publicaties. Hij reist als digitale nomade tussen de VAE, Turkije, Rusland en het GOS. Damir behaalde een bachelordiploma in natuurkunde, wat hem volgens hem de kritische denkvaardigheden heeft gegeven die nodig zijn om succesvol te zijn in het steeds veranderende landschap van internet.



