Notizie Tecnologia
21 settembre 2023

Amplifica il rilascio DALL-E 3 OpenAIL'influenza, la partenza Midjourney ed Stable Diffusion Alle spalle

In Breve

DALL-E 3 è destinato ad essere perfettamente integrato con GPT-4, appositamente studiato per ChatGPT+ abbonati.

DALL-E 3 si astiene dal ricreare immagini di personaggi pubblici quando i loro nomi sono esplicitamente menzionati.

La tempistica per l'accesso a DALL-E 3 è fissata per ottobre.

OpenAI ha presentato la sua ultima creazione: DALL-MI3. A differenza dei suoi predecessori, DALL-E 3 si concentra sul perfezionamento delle minuzie, affrontando questioni come lettere e dettagli intricati del corpo, come le dita. Il risultato? Una serie di immagini esteticamente gradevoli senza la necessità di suggerimenti o soluzioni alternative complesse.

Amplifica il rilascio DALL-E 3 OpenAIL'influenza, la partenza Midjourney ed Stable Diffusion Alle spalle

È importante notare che questa versione non include una serie completa di dettagli di implementazione, articoli o API. DALL-E 3 è invece destinato a integrarsi perfettamente GPT-4, appositamente studiato per ChatGPT+ abbonati.

Questo sviluppo potrebbe non rappresentare un cambiamento epocale nel panorama dell’intelligenza artificiale, ma piuttosto un passo avanti nella collaborazione tra modelli. Molti anticipano il prossimo Stable Diffusion modello offrirà una raffinatezza e un fascino artistico ancora maggiori.

Per metterlo in un contesto, OpenAIIl viaggio di attraverso la generazione di immagini tramite intelligenza artificiale è stato un bel viaggio:

  • 2021: DALL-E 1, un modello da 12 miliardi di parametri, è stato introdotto con informazioni limitate.
  • 2021: GLIDE, un modello da 2 miliardi di parametri, è stato presentato insieme a modelli open source da 300 milioni di parametri.
  • 2022: È arrivato DALL-E 2, con 2 miliardi di parametri, accompagnato da un documento unCLIP e API.
  • 2023: DALL-E 3 ha fatto il suo ingresso e, anche se i dettagli potrebbero essere un po' criptici, una cosa è chiara: si integrerà con GPT-4 per ChatGPT+ abbonati.

Al momento, le immagini di DALL-E 3 rimangono piuttosto scarse. Non esiste una base di codice, un post sul blog o un confronto dettagliato con lo stato dell'arte (SOTA). OpenAI sembra tenere le carte vicino al petto.

Amplifica il rilascio DALL-E 3 OpenAIL'influenza, la partenza Midjourney ed Stable Diffusion Alle spalle

Si pubblicizza che il modello possieda una comprensione più profonda delle sfumature e dei dettagli rispetto ai suoi predecessori. Ciò significa che si prevede che tradurre i tuoi concetti creativi in ​​immagini altamente precise sia un processo più fluido.

Una promessa interessante di DALL-E 3 è la sua integrazione con ChatGPT. Ciò implica che gli utenti non dovranno confrontarsi con la creazione di istruzioni complesse; dovrebbe essere sufficiente una breve descrizione, con ChatGPT generando abilmente istruzioni dettagliate per tuo conto.

OpenAI ha anche sottolineato l'importanza del contesto nei suggerimenti lunghi. DALL-E 3 è progettato per abbracciare la verbosità, rendendolo più in sintonia con il contesto descritto in istruzioni dettagliate.

Tuttavia, come con ogni nuovo modello di intelligenza artificiale, c’è un elemento sconosciuto. Anche se le prime ipotesi sembrano promettenti, la vera prova del nove arriverà con un utilizzo prolungato. Permangono domande sulla sua efficienza e velocità di funzionamento.

È probabile che DALL-E 3 sarà un processo di diffusione in più fasi, con GPT-4 fungendo da codificatore di testo. Gli intricati meccanismi di questa configurazione potrebbero rimanere avvolti nel segreto.

La tempistica per l'accesso a DALL-E 3 è fissata per ottobre, inizialmente per ChatGPT Plus e ChatGPT Utente aziendales, con la possibilità di un accesso più ampio per i ricercatori in seguito.

Leggi Anche: OpenAIAltman al Senato degli Stati Uniti per discutere i rischi dell'IA

Ombreggiatura ed Censura di DALL-E 3

Il punto focale principale dello sviluppo di DALL-E 3 è stato il meticoloso processo di contenimento delle sue capacità. Ciò ha comportato un rigoroso allineamento e filtri progettati per escludere tipi specifici di contenuto. Ad esempio, la modella si rifiuta categoricamente di generare immagini di personaggi famosi, replicare opere d'arte nello stile di artisti famosi o creare qualsiasi contenuto ritenuto non sicuro da OpenAIgli standard più esigenti. Questo approccio strategico non riguarda solo i limiti; è una misura proattiva volta a proteggere l'azienda da potenziali coinvolgimenti legali.

Eppure, al di là di questi filtri e allineamenti, emergono alcune osservazioni intriganti. DALL-E 3 sembra mostrare una certa debolezza quando si tratta di generare contenuti fotorealistici. Invece di produrre immagini che imitano perfettamente le fotografie reali, il risultato ha una qualità stilizzata distinta. Queste immagini realizzate con l'intelligenza artificiale emanano un aspetto quasi renderizzato e leggermente plastico. Anche se esplicitamente suggerito con la parola “fotografia”, il risultato rimane radicato nella sua caratteristica stilizzazione.

Suggerimento n. 1
Suggerimento n. 1: fotografia ravvicinata di un granchio eremita annidato nella sabbia bagnata, con la schiuma del mare nelle vicinanze e i dettagli del suo guscio e la consistenza della sabbia accentuati.
Suggerimento n. 2
Suggerimento n. 2: un vivace divano giallo a forma di banana si trova in un accogliente soggiorno, la sua curva culla una pila di cuscini colorati. sul pavimento in legno, un tappeto a motivi geometrici aggiunge un tocco di fascino eclettico, e una pianta in vaso si trova nell'angolo, protesa verso la luce del sole che filtra dalla finestra.
Suggerimento n. 3
Suggerimento n. 3: una foto di un antico relitto annidato sul fondo dell'oceano. Le piante marine hanno rivendicato la struttura in legno e i pesci nuotano dentro e fuori dai suoi spazi vuoti. Tesori sommersi e vecchi cannoni sono sparsi qua e là, offrendo uno sguardo al passato.

Vale la pena notare che, nonostante queste idiosincrasie, DALL-E 3 offre un assaggio di notevole potenziale. Tra le sue creazioni, alcuni esemplari mostrano una sorprendente somiglianza con le fotografie. Da tenere presente che il realismo simulato di queste immagini non è necessariamente in linea con come apparirebbe una fotografia autentica dello stesso soggetto, soprattutto se immersa sott'acqua.

Leggi Anche: Microsoft ha presentato Designer, il primo strumento professionale Text-to-Image basato su DALL-E 2

DALL-E 3 Caratteristiche e dettagli

Prendiamoci un momento per vagliare i pixel e leggere tra le righe per capire cosa offre veramente questo nuovo modello.

L'arte della stilizzazione: Sbirciando OpenAIl'account Instagram di, noterai un'abbondanza di opere d'arte caratterizzate da una stilizzazione squisita. Sebbene sia presente una serie impressionante di composizioni e disegni astratti, il modello sembra evitare di produrre contenuti fotorealistici. L’enfasi qui è sull’estetica e sulla creatività, non sull’imitazione della realtà.

Vincoli artistici: DALL-E 3 prende una strada diversa rispetto al suo predecessore. Si rifiuta categoricamente di creare immagini nello stile degli artisti viventi, un netto allontanamento da DALL-E 2, che potrebbe imitare gli stili di alcuni artisti. Ciò potrebbe sollevare le sopracciglia nella comunità creativa, in modo simile alla tiepida accoglienza di Stable Diffusion 2.0

Dare potere agli artisti: In una mossa per rispettare i diritti degli artisti, OpenAI consente agli artisti di escludere il proprio lavoro dalle future versioni DALL-E. Inviando un'immagine di cui possiedono i diritti, gli artisti possono richiederne l'esclusione dall'output del modello. Le future iterazioni di DALL-E eviteranno quindi di generare contenuti simili a stile dell'artista.

Sicurezza e censura: OpenAILa paranoia sulla sicurezza è palpabile. Hanno collaborato con "team rossi" esterni per testare la sicurezza del modello e hanno utilizzato classificatori di input per insegnare al modello a ignorare parole specifiche che potrebbero portare a contenuti espliciti o dannosi. DALL-E 3 si astiene dal ricreare immagini di figure pubbliche quando i loro nomi sono menzionati esplicitamente. Rimane incerto se le celebrità rientrino in questa categoria, il che potrebbe incidere sulla qualità dei volti generati.

Filigrane e tracciamento: C'è un accenno all'incorporamento di tag per tenere traccia delle "immagini generate dall'intelligenza artificiale", indicando un passo verso un migliore monitoraggio e potenzialmente il watermarking dei contenuti generati.

Testo e mani migliorati: OpenAI pubblicizza il miglioramento della generazione del testo e del rendering manuale, un'affermazione comune tra i concorrenti. La vera prova sta nel risultato reale, al di là degli esempi scelti con cura.

Comprensione spaziale: DALL-E 3 eccelle nella comprensione delle relazioni spaziali descritte nei prompt. Ciò migliora la capacità del modello di costruire angoli e composizioni complesse, anche se gli utenti attendono prove più concrete di questa promessa.

Il potere dei suggerimenti: Il punto cruciale di DALL-MI3 risiede nelle sue capacità tempestive e nell'integrazione con ChatGPT. Promette automazione, velocità e semplificazione della progettazione tempestiva. La tendenza qui è verso chatGPT generazione di prompt, traducendo idee vaghe o suggerimenti rudimentali in idee eloquenti. La migliore comprensione contestuale di DALL-E 3 semplifica il processo, consentendo agli utenti di concentrarsi sull'intento piuttosto che sulla verbosità.

Territori inesplorati: Particolarmente assenti dalla discussione sono aspetti come l'in-painting, l'outpainting, il riempimento generativo e la modellazione 3D. L'assenza di queste funzionalità potrebbe rappresentare un limite, soprattutto per gli utenti abituati a modelli più versatili.

Dettagli di accesso: DALL-E 3 sarà disponibile per ChatGPT Clienti Plus ed Enterprise all'inizio di ottobre. Tuttavia, le specifiche relative all'assegnazione dei crediti per ChatGPT Inoltre gli utenti e i costi associati rimangono poco chiari. L'accesso verrà fornito tramite l'API e il file OpenAI Piattaforma Labs “più avanti in autunno”.

Abilità di integrazione: DALL-E è destinato a essere perfettamente integrato nei prodotti partner e Microsoft. Aspettatevi di assistere alla generazione di presentazioni, illustrazioni, disegni, loghi, tutti contestualizzati e amplificati con l'assistenza di ChatGPT. Questa integrazione è destinata a diventare mainstream, ponendo una sfida significativa ai concorrenti Google con il suo Bardo e Ideogramma.

La convergenza di LLM e contenuto visivo: L'aspetto più intrigante risiede nella convergenza dei Large Language Models (LLM) e dei modelli di generazione di contenuti visivi. Significa il passaggio da una complessa ingegneria tempestiva all’espressione di idee in un linguaggio più accessibile. L’intelligenza artificiale raccoglierà contesto e idee da queste espressioni, offrendo possibilità creative a cui è difficile resistere.

Leggi Anche: I 50 migliori prompt di testo in immagine per i generatori artistici AI Midjourney e DALL-E

DALL-E 3: diventa un nuovo leader nella generazione di immagini AI

OpenAILa decisione di integrare DALL-E 3 nel ChatGPT l’ecosistema è una mossa strategica. Questa integrazione garantisce a DALL-E 3 l'accesso a un vasto database di utenti di 100 milioni di utenti attivi. Questo passaggio migliora significativamente l'accessibilità di DALL-E 3 e ha il potenziale per catapultarne la popolarità.

Attualmente, Midjourney ed Stable Diffusion vantarsi in giro 15 milioni di utenti registrati. Tuttavia, con questa integrazione, DALL-E 3 è destinato a ottenere l'accesso a una base di utenti dieci volte più ampia: 100 milioni di utenti. Questo rende il ChatGPT Abbonamento più la pianificazione è ancora più allettante in quanto offre l'accesso a un chatbot, strumenti analitici e generazione di immagini, il tutto a un prezzo conveniente.

L'integrazione non è vantaggiosa solo per gli utenti esistenti, ma funge anche da potente calamita per i nuovi utenti. Espande il OpenAI la portata e la popolarità dell'ecosistema, attirando persone che cercano soluzioni di contenuti generati dall'intelligenza artificiale.

Questa mossa strategica è destinata a dare impulso OpenAIle entrate di e altri parametri chiave. Gli investitori della società probabilmente vedranno favorevolmente questo sviluppo, soprattutto alla luce di un recente Calo del 20% nel volume del traffico durante l'estate.

ChatGPT Il traffico web crolla del 20% a settembre e continua a crollare

Leggi altri argomenti correlati:

Negazione di responsabilità

In linea con la Linee guida del progetto Trust, si prega di notare che le informazioni fornite in questa pagina non intendono essere e non devono essere interpretate come consulenza legale, fiscale, di investimento, finanziaria o di qualsiasi altra forma. È importante investire solo ciò che puoi permetterti di perdere e chiedere una consulenza finanziaria indipendente in caso di dubbi. Per ulteriori informazioni, suggeriamo di fare riferimento ai termini e alle condizioni nonché alle pagine di aiuto e supporto fornite dall'emittente o dall'inserzionista. MetaversePost si impegna a fornire report accurati e imparziali, ma le condizioni di mercato sono soggette a modifiche senza preavviso.

Circa l'autore

Damir è il team leader, il product manager e l'editore di Metaverse Post, che copre argomenti come AI/ML, AGI, LLM, Metaverse e Web3campi correlati. I suoi articoli attirano un vasto pubblico di oltre un milione di utenti ogni mese. Sembra essere un esperto con 10 anni di esperienza in SEO e marketing digitale. Damir è stato menzionato in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e altre pubblicazioni. Viaggia tra Emirati Arabi Uniti, Turchia, Russia e CSI come nomade digitale. Damir ha conseguito una laurea in fisica, che secondo lui gli ha fornito le capacità di pensiero critico necessarie per avere successo nel panorama in continua evoluzione di Internet. 

Altri articoli
Damir Jalalov
Damir Jalalov

Damir è il team leader, il product manager e l'editore di Metaverse Post, che copre argomenti come AI/ML, AGI, LLM, Metaverse e Web3campi correlati. I suoi articoli attirano un vasto pubblico di oltre un milione di utenti ogni mese. Sembra essere un esperto con 10 anni di esperienza in SEO e marketing digitale. Damir è stato menzionato in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e altre pubblicazioni. Viaggia tra Emirati Arabi Uniti, Turchia, Russia e CSI come nomade digitale. Damir ha conseguito una laurea in fisica, che secondo lui gli ha fornito le capacità di pensiero critico necessarie per avere successo nel panorama in continua evoluzione di Internet. 

Hot Stories
Iscriviti alla nostra newsletter.
Notizie

Da Ripple a The Big Green DAO: come i progetti di criptovaluta contribuiscono alla beneficenza

Esploriamo le iniziative che sfruttano il potenziale delle valute digitali per cause di beneficenza.

Per saperne di più

AlphaFold 3, Med-Gemini e altri: il modo in cui l'intelligenza artificiale trasforma l'assistenza sanitaria nel 2024

L'intelligenza artificiale si manifesta in vari modi nel settore sanitario, dalla scoperta di nuove correlazioni genetiche al potenziamento dei sistemi chirurgici robotici...

Per saperne di più
Unisciti alla nostra comunità tecnologica innovativa
Scopri di più
Per saperne di più
I 10 migliori strumenti IA gratuiti per la creazione di contenuti, l'editing video e altro ancora
AI Wiki digerire Istruzione Stile di vita Software Tecnologia
I 10 migliori strumenti IA gratuiti per la creazione di contenuti, l'editing video e altro ancora
14 Maggio 2024
La Securities Commission di Hong Kong mette in guardia dalle truffe deepfake che prendono di mira l'industria delle criptovalute: implicazioni per la sicurezza degli investitori
Stile di vita Sicurezza Wiki Software Storie e recensioni Tecnologia
La Securities Commission di Hong Kong mette in guardia dalle truffe deepfake che prendono di mira l'industria delle criptovalute: implicazioni per la sicurezza degli investitori
14 Maggio 2024
Ripple ed Evmos collaborano allo sviluppo di XRP Ledger EVM Sidechain con la tecnologia EvmOS
Affari Notizie Tecnologia
Ripple ed Evmos collaborano allo sviluppo di XRP Ledger EVM Sidechain con la tecnologia EvmOS
14 Maggio 2024
5ireChain avvia il "Testnet Thunder: GA" incentivato per gli stress test di rete e invita gli utenti a partecipare Airdrop Rewards
Notizie Tecnologia
5ireChain avvia il "Testnet Thunder: GA" incentivato per gli stress test di rete e invita gli utenti a partecipare Airdrop Rewards
14 Maggio 2024
LABORATORI DI CRITTOMERIA PTE. srl.