Novice Tehnologija
September 21, 2023

DALL-E 3 Release ojača OpenAIvpliv, odhod Midjourney in Stable Diffusion Zadaj

Na kratko

DALL-E 3 je nastavljen za popolno integracijo GPT-4, posebej prilagojen za ChatGPT+ naročniki.

DALL-E 3 se vzdrži poustvarjanja slik javnih osebnosti, kadar so njihova imena izrecno omenjena.

Časovnica za dostop do DALL-E 3 je določena za oktober.

OpenAI je predstavil svojo najnovejšo kreacijo: DALL-E3. Za razliko od svojih predhodnikov se DALL-E 3 osredotoča na izboljšanje podrobnosti, obravnava težave, kot so črke in zapletene podrobnosti telesa, kot so prsti. rezultat? Niz estetsko prijetnih slik brez potrebe po zapletenih pozivih ali rešitvah.

DALL-E 3 Release ojača OpenAIvpliv, odhod Midjourney in Stable Diffusion Zadaj

Pomembno je omeniti, da ta izdaja ne vsebuje celovitega niza podrobnosti o izvajanju, člankov ali API-jev. Namesto tega je DALL-E 3 nastavljen za brezhibno integracijo GPT-4, posebej prilagojen za ChatGPT+ naročniki.

Ta razvoj morda ni seizmični premik v pokrajini umetne inteligence, temveč korak naprej v sodelovanju med modeli. Mnogi predvidevajo, da bo naslednji Stable Diffusion Model bo ponudil še večjo prefinjenost in umetniško privlačnost.

Če postavimo v kontekst, OpenAIPotovanje osebe skozi ustvarjanje slik z umetno inteligenco je bilo precej težko:

  • 2021: DALL-E 1, model parametrov z 12 milijardami, je bil predstavljen z omejenimi informacijami.
  • 2021: GLIDE, model parametrov z 2 milijardama, je bil predstavljen skupaj z odprtokodnimi modeli parametrov s 300 milijoni.
  • 2022: Prispel je DALL-E 2 z 2 milijardama parametrov, skupaj s papirjem unCLIP in API-jem.
  • 2023: DALL-E 3 je vstopil in čeprav so podrobnosti morda nekoliko skrivnostne, je ena stvar jasna – integriral se bo z GPT-4 za ChatGPT+ naročniki.

Zaenkrat vizualni elementi DALL-E 3 ostajajo nekoliko redki. Ni kodne baze, objave v blogu ali podrobne primerjave z najsodobnejšim (SOTA). OpenAI zdi se, da drži svoje karte blizu svojih prsi.

DALL-E 3 Release ojača OpenAIvpliv, odhod Midjourney in Stable Diffusion Zadaj

Model naj bi v primerjavi s svojimi predhodniki globlje razumel nianse in podrobnosti. To pomeni, da bo prevajanje vaših ustvarjalnih konceptov v zelo natančne slike po pričakovanjih potekalo bolj gladko.

Ena zanimiva obljuba DALL-E 3 je njegova integracija z ChatGPT. To pomeni, da se uporabnikom ne bo treba ubadati z ustvarjanjem zapletenih pozivov; naj zadošča kratek opis, s ChatGPT spretno generiranje podrobnih pozivov v vašem imenu.

OpenAI je tudi poudaril pomen konteksta v dolgih pozivih. DALL-E 3 je zasnovan tako, da zajema podrobnost, zaradi česar je bolj prilagojen kontekstu, opisanemu v obsežnih pozivih.

Vendar, kot pri vsakem novem modelu AI, obstaja element neznanega. Čeprav so prvi vtisi videti obetavni, bo pravi lakmusov test prišel z daljšo uporabo. Postavljajo se vprašanja o njegovi učinkovitosti in hitrosti delovanja.

Verjetno bo DALL-E 3 večstopenjski proces razširjanja z GPT-4 ki služi kot kodirnik besedila. Zapletena mehanika te nastavitve morda ostane zavita v skrivnost.

Časovnica za dostop do DALL-E 3 je določena za oktober, sprva za ChatGPT Plus in ChatGPT Podjetniški uporabniks, z možnostjo nadaljnjega širšega dostopa za raziskovalce.

Podobni: OpenAIAltman v ameriškem senatu za razpravo o tveganjih umetne inteligence

Nianse in cenzura od DALL-E 3

Glavna osrednja točka razvoja DALL-E 3 je bil natančen proces omejevanja njegovih zmogljivosti. To je vključevalo strogo usklajevanje in filtre, zasnovane tako, da izključujejo določene vrste vsebine. Na primer, model odločno zavrača ustvarjanje slik znanih osebnosti, posnemanje umetniških del v slogu priznanih umetnikov ali ustvarjanje kakršne koli vsebine, za katero meni, da ni varna. OpenAIzahtevnih standardih. Pri tem strateškem pristopu ne gre samo za omejitve; je proaktiven ukrep, katerega cilj je zaščititi podjetje pred morebitnimi pravnimi zagatami.

Vendar zunaj teh filtrov in poravnav pridejo na dan nekatera zanimiva opažanja. Zdi se, da DALL-E 3 kaže določeno slabost, ko gre za ustvarjanje fotorealistične vsebine. Namesto ustvarjanja slik, ki brezhibno posnemajo prave fotografije, je rezultat izrazito stilizirane kakovosti. Te slike, izdelane z umetno inteligenco, izžarevajo skoraj upodobljen in rahlo plastičen videz. Tudi ko je izrecno pozvan z besedo »fotografija«, rezultat ostane zasidran v svoji značilni stilizaciji.

Poziv #1
Poziv št. 1: Fotografija raka puščavnika, ugnezdenega v mokrem pesku, z morsko peno v bližini in s poudarjenimi podrobnostmi njegovega oklepa in teksture peska.
Poziv #2
Poziv št. 2: Živahen rumen kavč v obliki banane stoji v prijetni dnevni sobi, njegova krivulja pa objema kup pisanih blazin. na lesenih tleh vzorčasta preproga doda pridih eklektičnega šarma, lončnica pa stoji v kotu in sega proti sončni svetlobi, ki se filtrira skozi okno.
Poziv #3
Poziv št. 3: Fotografija starodavne razbitine ladje, ugnezdene na oceanskem dnu. Morske rastline so si lastile leseno strukturo, ribe pa plavajo v in iz njenih votlih prostorov. Naokrog so raztreseni potopljeni zakladi in stari topovi, ki ponujajo pogled v preteklost.

Omeniti velja, da kljub tem posebnostim DALL-E 3 ponuja vpogled v izjemen potencial. Med njegovimi stvaritvami nekateri primerki izkazujejo presenetljivo podobnost s fotografijami. Upoštevati je treba, da se simulirani realizem teh slik ne ujema nujno s tem, kako bi izgledala pristna fotografija istega subjekta, zlasti če je potopljena pod vodo.

Podobni: Microsoft je predstavil Designer, prvo profesionalno orodje za pretvorbo besedila v sliko, ki temelji na DALL-E 2

Funkcije in podrobnosti DALL-E 3

Vzemimo si trenutek in preberimo slikovne pike in preberimo med vrsticami, da bomo razumeli, kaj ta novi model resnično ponuja.

Umetnost stilizacije: Pogled skozi OpenAIInstagram račun osebe, boste opazili obilico umetniških del, za katere je značilna izvrstna stilizacija. Medtem ko obstaja impresiven nabor abstraktnih kompozicij in dizajnov, se zdi, da se model izogiba ustvarjanju fotorealistične vsebine. Tu je poudarek na estetiki in ustvarjalnosti, ne pa na posnemanju realnosti.

Umetniške omejitve: DALL-E 3 ubira drugačno pot od svojega predhodnika. Odločno zavrača ustvarjanje slik v slogu živih umetnikov, kar je velik odmik od DALL-E 2, ki bi lahko posnemal sloge določenih umetnikov. To bi lahko dvignilo obrvi v ustvarjalni skupnosti, podobno kot mlačen sprejem Stable Diffusion 2.0.

Opolnomočenje umetnikov: V prizadevanju za spoštovanje pravic umetnikov, OpenAI omogoča umetnikom, da izključijo svoja dela iz prihodnjih različic DALL-E. Z oddajo slike, za katero imajo pravice, lahko umetniki zahtevajo njeno izključitev iz rezultatov modela. Prihodnje ponovitve DALL-E se bodo tako izognile ustvarjanju vsebine, ki je podobna umetnikov stil.

Varnost in cenzura: OpenAIParanoja glede varnosti je očitna. Sodelovali so z zunanjimi »rdečimi ekipami«, da bi preizkusili varnost modela in uporabili klasifikatorje vnosa, da bi model naučili prezreti določene besede, ki bi lahko vodile do eksplicitne ali škodljive vsebine. DALL-E 3 se vzdrži poustvarjanja slik javne osebnosti ko so njihova imena izrecno navedena. Ali znane osebnosti spadajo v to kategorijo, ostaja negotovo, kar lahko vpliva na kakovost ustvarjenih obrazov.

Vodni žigi in sledenje: Obstaja namig o vdelavi oznak za sledenje »slikam, ustvarjenim z umetno inteligenco«, kar kaže na premik k boljšemu spremljanju in morebitnemu vodnemu žigu ustvarjene vsebine.

Besedilo in roke so izboljšane: OpenAI oglašuje izboljšano ustvarjanje besedila in ročno upodabljanje, kar je pogosta trditev med konkurenti. Pravi preizkus je v dejanskem rezultatu, ki presega izbrane primere.

Prostorsko razumevanje: DALL-E 3 se odlikuje po razumevanju prostorskih odnosov, opisanih v pozivih. To povečuje zmožnost modela za konstruiranje kompleksnih kotov in kompozicij, čeprav uporabniki čakajo na konkretnejše dokaze te obljube.

Moč pozivov: Bistvo DALL-E3 je v njegovih hitrih zmogljivostih in integraciji z ChatGPT. Obljublja avtomatizacijo, hitrost in poenostavitev hitrega oblikovanja. Trend tukaj je proti chatGPT generiranje pozivov, prevajanje nejasnih idej ali osnovnih namigov v zgovorne. Izboljšano kontekstualno razumevanje DALL-E 3 poenostavi postopek in uporabnikom omogoča, da se osredotočijo na namero namesto na besednost.

Neznana ozemlja: V razpravi manjkajo predvsem vidiki, kot so in-painting, out-painting, generativno polnilo in 3D modeliranje. Odsotnost teh funkcij je lahko omejitev, zlasti za uporabnike, ki so navajeni bolj vsestranskih modelov.

Podrobnosti o dostopu: DALL-E 3 bo na voljo za ChatGPT Stranke Plus in Enterprise v začetku oktobra. Vendarle posebnosti glede dodeljevanja kreditov za ChatGPT Poleg tega uporabniki in s tem povezani stroški ostajajo nejasni. Dostop bo zagotovljen prek API-ja in OpenAI Platforma Labs "pozneje jeseni."

Zmogljivost integracije: DALL-E naj bi bil brezhibno integriran v partnerske in Microsoftove izdelke. Pričakujte, da boste priča ustvarjanju predstavitev, ilustracij, dizajnov, logotipov, vse v kontekstu in razširjeno s pomočjo ChatGPT. Ta integracija naj bi postala običajna in predstavlja velik izziv za konkurente, kot je Google s svojim Bardom in ideogram.

Konvergenca LLM in vizualne vsebine: Najbolj zanimiv vidik je konvergenca velikih jezikovnih modelov (LLM) in modelov za ustvarjanje vizualnih vsebin. Pomeni premik od zapletenega hitrega inženiringa k izražanju idej v bolj dostopnem jeziku. Umetna inteligenca bo iz teh izrazov zbrala kontekst in ideje ter ponudila ustvarjalne možnosti, ki se jim je težko upreti.

Podobni: 50 najboljših pozivov za pretvorbo besedila v sliko za generatorje umetnosti z umetno inteligenco Midjourney in DALL-E

DALL-E 3: Bodite novi vodja pri ustvarjanju slik z umetno inteligenco

OpenAIodločitev, da integrira DALL-E 3 v ChatGPT ekosistem je strateška poteza. Ta integracija omogoča DALL-E 3 dostop do obsežne podatkovne baze uporabnikov s 100 milijoni aktivnih uporabnikov. Ta korak bistveno izboljša dostopnost DALL-E 3 in ima potencial, da katapultira njegovo priljubljenost.

Trenutno Midjourney in Stable Diffusion hvaliti se 15 milijonov registriranih uporabnikov. Vendar pa naj bi s to integracijo DALL-E 3 pridobil dostop do desetkrat večje baze uporabnikov – 100 milijonov uporabnikov. To naredi ChatGPT Plus naročnina načrt še toliko bolj privlačen, saj ponuja dostop do chatbota, analitičnih orodij in ustvarjanja slik, vse po dostopni ceni.

Integracija ni le ugodna za obstoječe uporabnike, ampak služi tudi kot močan magnet za nove uporabnike. Razširja OpenAI doseg in priljubljenost ekosistema, ki pritegne posameznike, ki iščejo vsebinske rešitve, ustvarjene z umetno inteligenco.

Ta strateška poteza je pripravljena na povečanje OpenAIprihodek in druge ključne meritve. Vlagatelji podjetja bodo verjetno na ta razvoj gledali pozitivno, zlasti v luči nedavnega 20 % upad prometa med poletjem.

DALL-E 3 Release ojača OpenAIvpliv, odhod Midjourney in Stable Diffusion Zadaj
ChatGPT Spletni promet septembra pade za 20 % in še naprej strmo pada

Preberite več povezanih tem:

Zavrnitev odgovornosti

V skladu z Smernice projekta Trust, upoštevajte, da informacije na tej strani niso namenjene in se jih ne sme razlagati kot pravni, davčni, naložbeni, finančni ali kakršen koli drug nasvet. Pomembno je, da vlagate samo tisto, kar si lahko privoščite izgubiti, in da poiščete neodvisen finančni nasvet, če imate kakršne koli dvome. Za dodatne informacije predlagamo, da si ogledate določila in pogoje ter strani s pomočjo in podporo, ki jih nudi izdajatelj ali oglaševalec. MetaversePost se zavzema za natančno in nepristransko poročanje, vendar se tržni pogoji lahko spremenijo brez predhodnega obvestila.

O avtorju

Damir je vodja ekipe, produktni vodja in urednik pri Metaverse Post, ki pokriva teme, kot so AI/ML, AGI, LLMs, Metaverse in Web3- sorodna področja. Njegovi članki vsak mesec pritegnejo množično občinstvo več kot milijon uporabnikov. Zdi se, da je strokovnjak z 10-letnimi izkušnjami na področju SEO in digitalnega trženja. Damir je bil omenjen v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto in druge publikacije. Kot digitalni nomad potuje med ZAE, Turčijo, Rusijo in SND. Damir je diplomiral iz fizike, kar mu je po njegovem mnenju dalo sposobnosti kritičnega razmišljanja, potrebne za uspeh v nenehno spreminjajočem se okolju interneta. 

več člankov
Damir Yalalov
Damir Yalalov

Damir je vodja ekipe, produktni vodja in urednik pri Metaverse Post, ki pokriva teme, kot so AI/ML, AGI, LLMs, Metaverse in Web3- sorodna področja. Njegovi članki vsak mesec pritegnejo množično občinstvo več kot milijon uporabnikov. Zdi se, da je strokovnjak z 10-letnimi izkušnjami na področju SEO in digitalnega trženja. Damir je bil omenjen v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto in druge publikacije. Kot digitalni nomad potuje med ZAE, Turčijo, Rusijo in SND. Damir je diplomiral iz fizike, kar mu je po njegovem mnenju dalo sposobnosti kritičnega razmišljanja, potrebne za uspeh v nenehno spreminjajočem se okolju interneta. 

Hot Stories
Pridružite se našemu glasilu.
Zadnje novice

Zatišje pred nevihto Solana: Kaj zdaj sporočajo grafikoni, kiti in signali na verigi

Solana je pokazala močno uspešnost, ki jo je spodbudilo vse večje sprejemanje, institucionalno zanimanje in ključna partnerstva, hkrati pa se sooča s potencialnimi ...

Več o tem

Kriptovalute aprila 2025: ključni trendi, premiki in kaj sledi

Aprila 2025 se je kripto prostor osredotočil na krepitev osrednje infrastrukture, Ethereum pa se je pripravljal na Pectro ...

Več o tem
Preberi več
Preberi več
80 % trgovanja s kriptovalutami je avtomatiziranega – zakaj torej trgovci na drobno ne zaupajo temu? Izvršni direktor Arcanuma o odpravljanju največje vrzeli v verodostojnosti v panogi
Intervju Tehnologija
80 % trgovanja s kriptovalutami je avtomatiziranega – zakaj torej trgovci na drobno ne zaupajo temu? Izvršni direktor Arcanuma o odpravljanju največje vrzeli v verodostojnosti v panogi
April 16, 2026
CEX proti Onchainu je končan – pravi boj je za institucionalni pretok in nadzor nad trgom, pravijo panelisti na HSC Cannes 
Hack Seasons Intervju Tehnologija
CEX proti Onchainu je končan – pravi boj je za institucionalni pretok in nadzor nad trgom, pravijo panelisti na HSC Cannes 
April 16, 2026
99 % kovancev Meme je šlo na nič: Kaj mora Meme 3.0 narediti prav
Mnenje Tehnologija
99 % kovancev Meme je šlo na nič: Kaj mora Meme 3.0 narediti prav
April 16, 2026
Google predstavlja Gemini 3.1 Flash TTS: novo obdobje hiperrealističnega, popolnoma nadzorljivega ustvarjanja govora z umetno inteligenco
Novice Tehnologija
Google predstavlja Gemini 3.1 Flash TTS: novo obdobje hiperrealističnega, popolnoma nadzorljivega ustvarjanja govora z umetno inteligenco
April 16, 2026
CRYPTOMERIA LABS PTE. LTD.