Buletin de stiri Tehnologia
21 Septembrie, 2023

DALL-E 3 Release Amplifică OpenAIInfluența lui, plecarea Midjourney și Stable Diffusion In spate

Pe scurt

DALL-E 3 este setat să fie integrat perfect cu GPT-4, special croita pentru ChatGPT+ abonați.

DALL-E 3 se abține de la recrearea imaginilor unor persoane publice atunci când numele lor sunt menționate în mod explicit.

Termenul de acces la DALL-E 3 este stabilit pentru octombrie.

OpenAI și-a dezvăluit cea mai recentă creație: DALL-E3. Spre deosebire de predecesorii săi, DALL-E 3 se concentrează pe rafinarea detaliilor, abordând probleme precum literele și detaliile complicate ale corpului, cum ar fi degetele. Rezultatul? O serie de imagini plăcute din punct de vedere estetic, fără a fi nevoie de solicitări sau soluții complexe.

DALL-E 3 Release Amplifică OpenAIInfluența lui, plecarea Midjourney și Stable Diffusion In spate

Este important să rețineți că această versiune nu vine cu un set cuprinzător de detalii de implementare, articole sau API-uri. În schimb, DALL-E 3 este setat să fie integrat perfect cu GPT-4, special croita pentru ChatGPT+ abonați.

Această dezvoltare poate să nu fie o schimbare seismică în peisajul AI, ci mai degrabă un pas înainte în colaborarea între modele. Mulți anticipează că următoarea Stable Diffusion model va oferi și mai multă sofisticare și atractivitate artistică.

Pentru ao pune în context, OpenAICălătoria lui prin generarea de imagini AI a fost destul de o plimbare:

  • 2021: DALL-E 1, un model cu parametri de 12 miliarde, a fost introdus cu informații limitate.
  • 2021: GLIDE, un model cu 2 miliarde de parametri, a fost dezvăluit împreună cu modele open-source cu 300 de milioane de parametri.
  • 2022: A sosit DALL-E 2, cu 2 miliarde de parametri, însoțit de o hârtie unCLIP și API.
  • 2023: DALL-E 3 și-a făcut intrarea și, deși detaliile ar putea fi oarecum criptice, un lucru este clar: se va integra cu GPT-4 pentru ChatGPT+ abonați.

De acum, imaginile DALL-E 3 rămân oarecum rare. Nu există nicio bază de cod, postare pe blog sau comparație detaliată cu cea mai recentă tehnologie (SOTA). OpenAI pare să-și țină cărțile aproape de piept.

DALL-E 3 Release Amplifică OpenAIInfluența lui, plecarea Midjourney și Stable Diffusion In spate

Modelul este prezentat ca posedă o înțelegere mai profundă a nuanțelor și detaliilor în comparație cu predecesorii săi. Aceasta înseamnă că traducerea conceptelor tale creative în imagini extrem de precise este de așteptat să fie un proces mai ușor.

O promisiune interesantă a DALL-E 3 este integrarea cu ChatGPT. Acest lucru implică faptul că utilizatorii nu vor trebui să se lupte cu elaborarea de solicitări complicate; o scurtă descriere ar trebui să fie suficientă, cu ChatGPT generând cu pricepere solicitări detaliate în numele dvs.

OpenAI a subliniat, de asemenea, importanța contextului în solicitările lungi. DALL-E 3 este proiectat să îmbrățișeze verbozitatea, făcându-l mai adaptat la contextul descris în instrucțiuni extinse.

Cu toate acestea, ca și în cazul oricărui model nou AI, există un element de necunoscut. În timp ce privirile inițiale par promițătoare, adevăratul test de turnesol va veni cu o utilizare extinsă. Rămân întrebări cu privire la eficiența și viteza de funcționare a acestuia.

Este probabil ca DALL-E 3 să fie un proces de difuzie în mai multe etape, cu GPT-4 servind drept codificator de text. Mecanica complicată a acestei configurații poate rămâne învăluită în secret.

Termenul de acces la DALL-E 3 este stabilit pentru octombrie, inițial pentru ChatGPT Plus și ChatGPT Utilizator Enterprises, cu o posibilitate de acces mai larg pentru cercetători ulterior.

Legate de: OpenAIAltman la Senatul SUA pentru a discuta despre riscurile AI

Nuante și Cenzură din DALL-E 3

Punctele focale principale ale dezvoltării lui DALL-E 3 a fost procesul meticulos de reducere a capacităților acestuia. Aceasta a implicat o aliniere strictă și filtre concepute pentru a exclude anumite tipuri de conținut. De exemplu, modelul refuză categoric să genereze imagini ale unor personalități celebre, să reproducă opere de artă în stilul unor artiști renumiți sau să creeze orice conținut considerat nesigur de către OpenAIstandardele exigente ale lui. Această abordare strategică nu se referă doar la limitări; este o măsură proactivă menită să protejeze compania de potențiale probleme juridice.

Cu toate acestea, dincolo de aceste filtre și alinieri, unele observații interesante ies la lumină. DALL-E 3 pare să prezinte o anumită slăbiciune atunci când vine vorba de generarea de conținut fotorealist. În loc să producă imagini care imită perfect fotografiile reale, rezultatul are o calitate stilizată distinctă. Aceste imagini realizate de inteligență artificială emană un aspect aproape redat și ușor plastic. Chiar și atunci când este solicitat în mod explicit cu cuvântul „fotografie”, rezultatul rămâne înrădăcinat în stilizarea sa caracteristică.

Solicitarea #1
Prompt #1: Fotografie în prim-plan a unui crab pustnic cuibărit în nisip umed, cu spumă de mare în apropiere și detaliile cochiliei și textura nisipului accentuate.
Solicitarea #2
Prompt #2: O canapea galben vibrant în formă de banană se află într-o cameră de zi confortabilă, curba ei legănând un morman de perne colorate. pe podeaua din lemn, un covor cu model adaugă o notă de farmec eclectic, iar o plantă în ghiveci stă în colț, ajungând spre lumina soarelui care se filtrează prin fereastră.
Solicitarea #3
Prompt # 3: O fotografie a unui naufragiu vechi cuibărit pe fundul oceanului. Plantele marine au revendicat structura din lemn, iar peștii înoată în și din spațiile sale goale. Comori scufundate și tunuri vechi sunt împrăștiate în jur, oferind o privire în trecut.

Merită remarcat faptul că, în ciuda acestor idiosincrazii, DALL-E 3 oferă o privire de potențial remarcabil. Printre creațiile sale, unele cazuri prezintă o asemănare izbitoare cu fotografiile. De reținut că realismul simulat al acestor imagini nu se aliniază neapărat cu modul în care ar apărea o fotografie autentică a aceluiași subiect, mai ales dacă este scufundată sub apă.

Legate de: Microsoft a dezvăluit Designer, primul instrument profesional de transformare a textului în imagine bazat pe DALL-E 2

DALL-E 3 Caracteristici și detalii

Să luăm un moment să cercetăm pixelii și să citim printre rânduri pentru a înțelege ce oferă cu adevărat acest nou model.

Arta stilizării: Privind prin OpenAIcontul de Instagram al lui, veți observa o abundență de lucrări de artă caracterizate de o stilizare rafinată. Deși există o gamă impresionantă de compoziții și modele abstracte, modelul pare să evite producerea de conținut fotorealist. Accentul aici este pus pe estetică și creativitate, nu pe imitarea realității.

Constrângeri artistice: DALL-E 3 ia o cale diferită față de predecesorul său. Refuză categoric să creeze imagini în stilul artiștilor vii, o abatere totală de la DALL-E 2, care ar putea imita stilurile anumitor artiști. Acest lucru ar putea ridica sprâncene în comunitatea creativă, similar cu primirea călduță a Stable Diffusion 2.0.

Împuternicirea artiștilor: Într-o mișcare de a respecta drepturile artiștilor, OpenAI permite artiștilor să-și excludă lucrările din viitoarele versiuni DALL-E. Trimitând o imagine asupra căreia îi dețin drepturile, artiștii pot solicita excluderea acesteia din producția modelului. Iterațiile viitoare ale DALL-E vor evita apoi generarea de conținut asemănător cu stilul artistului.

Securitate și cenzură: OpenAIParanoia despre securitate este palpabilă. Au colaborat cu „echipe roșii” externe pentru a testa securitatea modelului și au folosit clasificatori de intrare pentru a-l învăța pe model să ignore anumite cuvinte care ar putea duce la conținut explicit sau dăunător. DALL-E 3 se abține de la a recrea imagini ale Persoane publice când numele lor sunt menționate în mod explicit. Dacă celebritățile se încadrează în această categorie rămâne incert, ceea ce poate afecta calitatea fețelor generate.

Filigrane și urmărire: Există un indiciu cu privire la încorporarea etichetelor pentru a urmări „imaginile generate de AI”, indicând o mișcare către o monitorizare mai bună și conținutul generat potențial de filigranare.

Text și mâini îmbunătățite: OpenAI oferă o generare de text îmbunătățită și redare manuală, o afirmație comună printre concurenți. Adevăratul test constă în rezultatul real dincolo de exemplele selectate.

Înțelegerea spațială: DALL-E 3 excelează în înțelegerea relațiilor spațiale descrise în prompturi. Acest lucru îmbunătățește capacitatea modelului de a construi unghiuri și compoziții complexe, deși utilizatorii așteaptă dovezi mai concrete ale acestei promisiuni.

Puterea îndemnurilor: Cheia de DALL-E3 constă în capabilitățile sale prompte și integrarea cu ChatGPT. Promite automatizare, viteză și simplificare a proiectării prompte. Tendința aici este spre chatGPT generarea de prompturi, traducând idei vagi sau îndemnuri rudimentare în altele elocvente. Înțelegerea contextuală îmbunătățită a DALL-E 3 simplifică procesul, permițând utilizatorilor să se concentreze pe intenție și nu pe verbozitate.

Teritorii neexplorate: În mod semnificativ absente din discuție sunt aspecte precum pictura în interior, pictura în exterior, umplerea generativă și modelarea 3D. Absența acestor caracteristici ar putea fi o limitare, mai ales pentru utilizatorii obișnuiți cu modele mai versatile.

Detalii de acces: DALL-E 3 este setat să devină disponibil pentru ChatGPT Clienții Plus și Enterprise la începutul lunii octombrie. Cu toate acestea, specificul privind alocarea creditelor pt ChatGPT În plus, utilizatorii și costurile asociate rămân neclare. Accesul va fi asigurat prin API și prin OpenAI Platforma Labs „mai târziu în toamnă”.

Performanța de integrare: DALL-E este setat să fie integrat perfect în produsele partenere și Microsoft. Așteptați-vă să asistați la generarea de prezentări, ilustrații, desene, logo-uri, toate în context și amplificate cu asistența din partea ChatGPT. Această integrare va deveni mainstream, reprezentând o provocare semnificativă pentru concurenți precum Google cu Bard-ul său și Ideograma.

Convergența LLM și a conținutului vizual: Cel mai intrigant aspect constă în convergența modelelor de limbaj mari (LLM) și a modelelor de generare de conținut vizual. Semnifică o trecere de la o inginerie complexă promptă la exprimarea ideilor într-un limbaj mai accesibil. AI va culege context și idei din aceste expresii, oferind posibilități creative greu de rezistat.

Legate de: Top 50 de solicitări text-to-image pentru generatoarele de artă AI Midjourney și DALL-E

DALL-E 3: Fii un nou lider în generarea de imagini AI

OpenAIdecizia lui de a integra DALL-E 3 în ChatGPT ecosistemul este o mișcare strategică. Această integrare oferă DALL-E 3 acces la o bază de date vastă de utilizatori de 100 de milioane de utilizatori activi. Acest pas îmbunătățește semnificativ accesibilitatea DALL-E 3 și are potențialul de a-i catapulta popularitatea.

În prezent, Midjourney și Stable Diffusion lauda in jur 15 milioane de utilizatori înregistrați. Cu toate acestea, cu această integrare, DALL-E 3 este setat să obțină acces la o bază de utilizatori de zece ori mai mare - 100 de milioane de utilizatori. Acest lucru face ca ChatGPT Plus abonament planul cu atât mai atrăgător, cu cât oferă acces la un chatbot, instrumente analitice și generare de imagini, toate la un preț accesibil.

Integrarea nu este doar avantajoasă pentru utilizatorii existenți, dar servește și ca un magnet puternic pentru utilizatorii noi. Se extinde OpenAI acoperirea și popularitatea ecosistemului, atragând indivizi care caută soluții de conținut generate de inteligență artificială.

Această mișcare strategică este gata să se amplifice OpenAIveniturile lui și alte valori cheie. Investitorii companiei vor vedea probabil această evoluție în mod favorabil, mai ales în lumina unei recente Scădere cu 20% a volumului de trafic în timpul verii.

ChatGPT Traficul web scade cu 20% în septembrie și continuă să scadă

Citiți mai multe subiecte conexe:

Declinare a responsabilităţii

În conformitate cu Ghidurile proiectului Trust, vă rugăm să rețineți că informațiile furnizate pe această pagină nu sunt destinate și nu trebuie interpretate ca fiind consiliere juridică, fiscală, investițională, financiară sau orice altă formă de consiliere. Este important să investești doar ceea ce îți poți permite să pierzi și să cauți sfaturi financiare independente dacă ai îndoieli. Pentru informații suplimentare, vă sugerăm să consultați termenii și condițiile, precum și paginile de ajutor și asistență furnizate de emitent sau agent de publicitate. MetaversePost se angajează să raporteze corecte, imparțial, dar condițiile de piață pot fi modificate fără notificare.

Despre autor

Damir este liderul echipei, manager de produs și editor la Metaverse Post, care acoperă subiecte precum AI/ML, AGI, LLM-uri, Metaverse și Web3-domenii conexe. Articolele sale atrag o audiență masivă de peste un milion de utilizatori în fiecare lună. El pare a fi un expert cu 10 ani de experiență în SEO și marketing digital. Damir a fost menționat în Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto și alte publicații. Călătorește între Emiratele Arabe Unite, Turcia, Rusia și CSI ca nomad digital. Damir a obținut o diplomă de licență în fizică, despre care crede că i-a oferit abilitățile de gândire critică necesare pentru a avea succes în peisajul în continuă schimbare al internetului. 

Mai multe articole
Damir Yalalov
Damir Yalalov

Damir este liderul echipei, manager de produs și editor la Metaverse Post, care acoperă subiecte precum AI/ML, AGI, LLM-uri, Metaverse și Web3-domenii conexe. Articolele sale atrag o audiență masivă de peste un milion de utilizatori în fiecare lună. El pare a fi un expert cu 10 ani de experiență în SEO și marketing digital. Damir a fost menționat în Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto și alte publicații. Călătorește între Emiratele Arabe Unite, Turcia, Rusia și CSI ca nomad digital. Damir a obținut o diplomă de licență în fizică, despre care crede că i-a oferit abilitățile de gândire critică necesare pentru a avea succes în peisajul în continuă schimbare al internetului. 

Hot Stories
Alăturați-vă Newsletter-ului nostru.
Ultimele ştiri

De la Ripple la Big Green DAO: Cum contribuie proiectele de criptomonede la caritate

Să explorăm inițiativele care valorifică potențialul monedelor digitale pentru cauze caritabile.

Aflați mai multe

AlphaFold 3, Med-Gemini și alții: modul în care AI transformă asistența medicală în 2024

Inteligența artificială se manifestă în diferite moduri în asistența medicală, de la descoperirea de noi corelații genetice până la abilitarea sistemelor chirurgicale robotizate...

Aflați mai multe
Alăturați-vă comunității noastre tehnologice inovatoare
Citeste mai mult
Află mai multe
Crypto Exchange Kraken a fost șantajat după raportarea recompenselor de eroare, 3 milioane de dolari retrase din activele trezoreriei
Buletin de stiri Tehnologia
Crypto Exchange Kraken a fost șantajat după raportarea recompenselor de eroare, 3 milioane de dolari retrase din activele trezoreriei
19 Iunie, 2024
Pendle asigură Arbitrum STIP Bridge Grant și intenționează să aloce 1 milion de recompense ARB furnizorilor de lichidități Arbitrum
pieţe Buletin de stiri Tehnologia
Pendle asigură Arbitrum STIP Bridge Grant și intenționează să aloce 1 milion de recompense ARB furnizorilor de lichidități Arbitrum
19 Iunie, 2024
Conectarea rețelelor blockchain: cum ERC-7683 își propune să transforme schimburile și tranzacțiile în lanțuri încrucișate
Opinie pieţe Software Tehnologia
Conectarea rețelelor blockchain: cum ERC-7683 își propune să transforme schimburile și tranzacțiile în lanțuri încrucișate
19 Iunie, 2024
Lido lansează adoptarea timpurie pentru modulul de miză comunitară pentru a-i integra pe stakers solo înainte de lansarea sa generală
Buletin de stiri Tehnologia
Lido lansează adoptarea timpurie pentru modulul de miză comunitară pentru a-i integra pe stakers solo înainte de lansarea sa generală
19 Iunie, 2024
CRYPTOMERIA LABS PTE. LTD.