Novinová správa Technológia
September 21, 2023

DALL-E 3 Release Zosilňuje OpenAIVplyv, odchod Midjourney a Stable Diffusion za

Stručne

DALL-E 3 je nastavený na bezproblémovú integráciu GPT-4, špeciálne prispôsobené pre ChatGPT+ predplatiteľov.

DALL-E 3 sa zdržuje vytvárania obrázkov verejných činiteľov, ak sú ich mená výslovne uvedené.

Časová os prístupu k DALL-E 3 je stanovená na október.

OpenAI predstavil svoj najnovší výtvor: DALL-E3. Na rozdiel od svojich predchodcov sa DALL-E 3 zameriava na vylepšovanie detailov, riešenie problémov, ako sú nápisy a zložité detaily tela, ako sú prsty. Výsledok? Množstvo esteticky príjemných obrázkov bez potreby zložitých výziev alebo riešení.

DALL-E 3 Release Zosilňuje OpenAIVplyv, odchod Midjourney a Stable Diffusion za

Je dôležité poznamenať, že toto vydanie neprichádza s komplexným súborom podrobností o implementácii, článkov alebo rozhraní API. Namiesto toho je DALL-E 3 nastavený na bezproblémovú integráciu GPT-4, špeciálne prispôsobené pre ChatGPT+ predplatiteľov.

Tento vývoj nemusí byť seizmickým posunom v prostredí AI, ale skôr krokom vpred v spolupráci medzi modelmi. Mnohí predpokladajú, že nabudúce Stable Diffusion model ponúkne ešte väčšiu sofistikovanosť a umeleckú príťažlivosť.

Aby som to uviedol do kontextu, OpenAICesta cez generovanie obrázkov AI bola celkom náročná:

  • 2021: DALL-E 1, model s 12 miliardami parametrov, bol predstavený s obmedzenými informáciami.
  • 2021: GLIDE, model s 2 miliardami parametrov, bol predstavený spolu s modelmi s otvoreným zdrojom s 300 miliónmi parametrov.
  • 2022: Prišiel DALL-E 2 s 2 miliardami parametrov, spolu s papierom unCLIP a API.
  • 2023: DALL-E 3 sa dostal na trh a hoci detaily môžu byť trochu záhadné, jedna vec je jasná – bude sa integrovať s GPT-4 pre ChatGPT+ predplatiteľov.

Odteraz je vizuál DALL-E 3 trochu vzácny. Nechýba kódová báza, blogový príspevok ani podrobné porovnanie s najmodernejšou technológiou (SOTA). OpenAI Zdá sa, že karty drží pri hrudi.

DALL-E 3 Release Zosilňuje OpenAIVplyv, odchod Midjourney a Stable Diffusion za

Model je propagovaný tak, aby mal v porovnaní so svojimi predchodcami hlbšie pochopenie nuancií a detailov. To znamená, že preklad vašich kreatívnych konceptov do vysoko presných obrázkov bude plynulejší.

Jedným zo zaujímavých prísľubov DALL-E 3 je jeho integrácia s ChatGPT. To znamená, že používatelia sa nebudú musieť potýkať s vytváraním zložitých výziev; mal by stačiť stručný popis, s ChatGPT vhodne generovať podrobné výzvy vo vašom mene.

OpenAI tiež zdôraznil dôležitosť kontextu v dlhých výzvach. DALL-E 3 je navrhnutý tak, aby zahŕňal výrečnosť, vďaka čomu je lepšie prispôsobený kontextu opísanému v rozsiahlych výzvach.

Napriek tomu, ako pri každom novom modeli AI, je tu prvok neznáma. Zatiaľ čo prvé pohľady vyzerajú sľubne, skutočný lakmusový papierik príde s rozšíreným používaním. Otázkou zostáva jeho účinnosť a rýchlosť prevádzky.

Je pravdepodobné, že DALL-E 3 bude viacstupňový proces šírenia, s GPT-4 slúži ako kódovač textu. Zložitá mechanika tohto nastavenia môže zostať zahalená rúškom tajomstva.

Časová os prístupu k DALL-E 3 je stanovená na október, pôvodne na ChatGPT Plus a ChatGPT Podnikový používateľs, s možnosťou širšieho prístupu pre výskumníkov.

príbuzný: OpenAIAltman v Senáte USA, aby diskutoval o rizikách AI

nuansy a cenzúra z DALL-E 3

Hlavnými bodmi vývoja DALL-E 3 bol starostlivý proces obmedzovania jeho schopností. To zahŕňalo prísne zarovnanie a filtre navrhnuté tak, aby vylúčili konkrétne typy obsahu. Modelka napríklad rozhodne odmieta vytvárať obrázky známych osobností, replikovať umelecké diela v štýle renomovaných umelcov alebo vytvárať akýkoľvek obsah, ktorý by považovali za nebezpečný. OpenAInáročné štandardy. Tento strategický prístup nie je len o obmedzeniach; je to proaktívne opatrenie zamerané na ochranu spoločnosti pred potenciálnymi právnymi zápletkami.

Okrem týchto filtrov a zarovnaní však vychádzajú na povrch niektoré zaujímavé pozorovania. Zdá sa, že DALL-E 3 vykazuje určitú slabosť, pokiaľ ide o vytváranie fotorealistického obsahu. Namiesto vytvárania obrázkov, ktoré bezchybne napodobňujú skutočné fotografie, výstup prináša výraznú štylizovanú kvalitu. Tieto obrázky vytvorené AI vyžarujú takmer vykreslený a mierne plastický vzhľad. Aj keď je výsledok vyslovene vyzvaný slovom „fotografia“, zostáva zakorenený vo svojej charakteristickej štylizácii.

Výzva č. 1
Výzva č. 1: Detailná fotografia kraba pustovníka usadeného vo vlhkom piesku s morskou penou v blízkosti a zvýraznenými detailmi jeho panciera a textúry piesku.
Výzva č. 2
Výzva č. 2: Žiarivá žltá pohovka v tvare banánu sa nachádza v útulnej obývačke a jej krivka kolíše nad hromadou farebných vankúšov. na drevenej podlahe dodáva vzorovaný koberec nádych eklektického šarmu a v rohu je umiestnená rastlina v črepníkoch, ktorá siaha k slnečnému svetlu filtrujúcemu cez okno.
Výzva č. 3
Výzva č. 3: Fotografia starovekého vraku lode uhniezdeného na dne oceánu. Morské rastliny si nárokovali drevenú konštrukciu a ryby plávajú do a von z jej dutých priestorov. Okolo sú roztrúsené potopené poklady a staré delá, ktoré poskytujú pohľad do minulosti.

Stojí za zmienku, že napriek týmto zvláštnostiam ponúka DALL-E 3 pohľad na pozoruhodný potenciál. Medzi jeho výtvormi niektoré prípady vykazujú nápadnú podobnosť s fotografiami. Majte na pamäti, že simulovaný realizmus týchto obrázkov sa nemusí nevyhnutne zhodovať s tým, ako by vyzerala skutočná fotografia toho istého objektu, najmä ak je ponorená pod vodou.

príbuzný: Microsoft predstavil Designer, prvý profesionálny nástroj na prevod textu na obrázok založený na DALL-E 2

DALL-E 3 Vlastnosti a detaily

Venujme chvíľu preberaniu pixelov a čítaniu medzi riadkami, aby sme pochopili, čo tento nový model skutočne ponúka.

Umenie štylizácie: Pohľad cez OpenAIinstagramový účet používateľa, všimnete si množstvo umeleckých diel charakterizovaných vynikajúcou štylizáciou. Aj keď existuje pôsobivá škála abstraktných kompozícií a dizajnov, zdá sa, že model sa vyhýba vytváraniu fotorealistického obsahu. Dôraz je tu kladený na estetiku a kreativitu, nie na napodobňovanie reality.

Umelecké obmedzenia: DALL-E 3 ide inou cestou ako jeho predchodca. Rozhodne odmieta vytvárať obrazy v štýle žijúcich umelcov, čo je výrazný odklon od DALL-E 2, ktorý by mohol napodobňovať štýly určitých umelcov. To by mohlo zdvihnúť obočie v kreatívnej komunite, podobne ako vlažný príjem Stable Diffusion 2.0.

Posilnenie umelcov: V snahe rešpektovať práva umelcov, OpenAI umožňuje umelcom vylúčiť svoju prácu z budúcich verzií DALL-E. Odoslaním obrázka, na ktorý vlastnia práva, môžu umelci požiadať o jeho vylúčenie z výstupu modelu. Budúce iterácie DALL-E sa potom vyhnú generovaniu obsahu podobného štýl umelca.

Bezpečnosť a cenzúra: OpenAIParanoja o bezpečnosti je hmatateľná. Spolupracovali s externými „červenými tímami“ na testovaní bezpečnosti modelu a použili vstupné klasifikátory, aby naučili model ignorovať konkrétne slová, ktoré by mohli viesť k explicitnému alebo škodlivému obsahu. DALL-E 3 sa zdrží opätovného vytvárania obrázkov verejné osobnosti keď sú výslovne uvedené ich mená. Či celebrity patria do tejto kategórie, zostáva neisté, čo môže mať vplyv na kvalitu generovaných tvárí.

Vodoznaky a sledovanie: Existuje náznak vkladania značiek na sledovanie „obrázkov generovaných AI“, čo naznačuje posun smerom k lepšiemu monitorovaniu a potenciálnemu vodoznaku generovaného obsahu.

Text a ruky vylepšené: OpenAI ponúka vylepšené generovanie textu a ručné vykresľovanie, čo je bežné tvrdenie medzi konkurentmi. Skutočný test spočíva v skutočnom výstupe nad rámec vybraných príkladov.

Priestorové porozumenie: DALL-E 3 vyniká v chápaní priestorových vzťahov opísaných vo výzvach. To zlepšuje schopnosť modelu konštruovať zložité uhly a kompozície, hoci používatelia čakajú na konkrétnejšie dôkazy tohto sľubu.

Sila výziev: Základom DALL-E3 spočíva v jeho rýchlych schopnostiach a integrácii s ChatGPT. Sľubuje automatizáciu, rýchlosť a zjednodušenie rýchleho návrhu. Trend tu smeruje k chatGPT generovanie výziev, prekladanie nejasných myšlienok alebo základných podnetov do výrečných. Zlepšené kontextové chápanie DALL-E 3 zefektívňuje proces a umožňuje používateľom sústrediť sa na zámer nad výrečnosťou.

Neprebádané územia: V diskusii výrazne chýbajú aspekty ako premaľovanie, premaľovanie, generatívna výplň a 3D modelovanie. Absencia týchto funkcií by mohla byť obmedzením najmä pre používateľov zvyknutých na všestrannejšie modely.

Podrobnosti prístupu: DALL-E 3 je nastavený tak, aby bol dostupný pre ChatGPT Zákazníci Plus a Enterprise začiatkom októbra. Avšak špecifiká ohľadom prideľovania kreditov za ChatGPT Plus používatelia a súvisiace náklady zostávajú nejasné. Prístup bude poskytovaný cez API a OpenAI Platforma Labs „neskôr na jeseň“.

Schopnosť integrácie: DALL-E je pripravený na bezproblémovú integráciu do produktov partnerov a Microsoftu. Očakávajte, že budete svedkami vytvárania prezentácií, ilustrácií, návrhov, log, všetko v kontexte a zosilnené s pomocou od ChatGPT. Táto integrácia sa má stať hlavným prúdom, čo predstavuje značnú výzvu pre konkurentov, ako sú Google so svojím Bardom a Ideogram.

Konvergencia LLM a vizuálneho obsahu: Najzaujímavejší aspekt spočíva v konvergencii veľkých jazykových modelov (LLM) a modelov generovania vizuálneho obsahu. Znamená to posun od komplexného rýchleho inžinierstva k vyjadrovaniu myšlienok prístupnejším jazykom. Umelá inteligencia získa kontext a nápady z týchto výrazov a ponúkne kreatívne možnosti, ktorým je ťažké odolať.

príbuzný: 50 najlepších výziev na prevod textu na obrázok pre generátory umenia AI Midjourney a DALL-E

DALL-E 3: Staňte sa novým lídrom vo vytváraní AI obrázkov

OpenAIrozhodnutie integrovať DALL-E 3 do ChatGPT ekosystém je strategický krok. Táto integrácia poskytuje DALL-E 3 prístup k rozsiahlej databáze používateľov so 100 miliónmi aktívnych používateľov. Tento krok výrazne zlepšuje dostupnosť DALL-E 3 a má potenciál katapultovať jeho popularitu.

V súčasnej dobe, Midjourney a Stable Diffusion chváliť sa okolo seba 15 miliónov registrovaných používateľov. Vďaka tejto integrácii je však DALL-E 3 nastavený tak, aby získal prístup k desaťkrát väčšej používateľskej základni – 100 miliónom používateľov. Toto robí ChatGPT Plus predplatné plán je o to príťažlivejší, pretože ponúka prístup k chatbotovi, analytickým nástrojom a generovaniu obrázkov, a to všetko za prijateľnú cenu.

Integrácia je výhodná nielen pre existujúcich používateľov, ale slúži aj ako silný magnet pre nových používateľov. Rozširuje to OpenAI dosah a popularita ekosystému, ktorá priťahuje jednotlivcov, ktorí hľadajú riešenia obsahu vytvorené umelou inteligenciou.

Tento strategický krok je pripravený podporiť OpenAIvýnosy a ďalšie kľúčové metriky. Investori spoločnosti budú pravdepodobne vnímať tento vývoj priaznivo, najmä vo svetle nedávnych udalostí 20% pokles objemu dopravy v lete.

DALL-E 3 Release Zosilňuje OpenAIVplyv, odchod Midjourney a Stable Diffusion za
ChatGPT Návštevnosť webu v septembri klesá o 20 % a naďalej klesá

Prečítajte si ďalšie súvisiace témy:

Vylúčenie zodpovednosti

V súlade s Pokyny k projektu Trust, uvedomte si, že informácie uvedené na tejto stránke nie sú zamýšľané a nemali by byť interpretované ako právne, daňové, investičné, finančné alebo iné formy poradenstva. Je dôležité investovať len toľko, koľko si môžete dovoliť stratiť a v prípade akýchkoľvek pochybností vyhľadať nezávislé finančné poradenstvo. Ak chcete získať ďalšie informácie, odporúčame vám pozrieť si zmluvné podmienky, ako aj stránky pomoci a podpory poskytnuté vydavateľom alebo inzerentom. MetaversePost sa zaviazala poskytovať presné a nezaujaté správy, ale podmienky na trhu sa môžu zmeniť bez upozornenia.

O autorovi

Damir je vedúci tímu, produktový manažér a redaktor v Metaverse Post, pokrývajúce témy ako AI/ML, AGI, LLM, Metaverse a Web3- súvisiace oblasti. Jeho články priťahujú každý mesiac obrovské publikum s viac ako miliónom používateľov. Zdá sa, že je odborníkom s 10-ročnými skúsenosťami v oblasti SEO a digitálneho marketingu. Damir bol spomenutý v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a ďalšie publikácie. Ako digitálny nomád cestuje medzi SAE, Tureckom, Ruskom a SNŠ. Damir získal bakalársky titul z fyziky, o ktorom sa domnieva, že mu dal schopnosti kritického myslenia potrebné na to, aby bol úspešný v neustále sa meniacom prostredí internetu. 

Ďalšie články
Damir Yalalov
Damir Yalalov

Damir je vedúci tímu, produktový manažér a redaktor v Metaverse Post, pokrývajúce témy ako AI/ML, AGI, LLM, Metaverse a Web3- súvisiace oblasti. Jeho články priťahujú každý mesiac obrovské publikum s viac ako miliónom používateľov. Zdá sa, že je odborníkom s 10-ročnými skúsenosťami v oblasti SEO a digitálneho marketingu. Damir bol spomenutý v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a ďalšie publikácie. Ako digitálny nomád cestuje medzi SAE, Tureckom, Ruskom a SNŠ. Damir získal bakalársky titul z fyziky, o ktorom sa domnieva, že mu dal schopnosti kritického myslenia potrebné na to, aby bol úspešný v neustále sa meniacom prostredí internetu. 

Hot Stories
Pridajte sa k nášmu newsletteru.
Novinky

Od zvlnenia k veľkému zelenému DAO: Ako kryptomenové projekty prispievajú k charite

Poďme preskúmať iniciatívy, ktoré využívajú potenciál digitálnych mien na charitatívne účely.

vedieť viac

AlphaFold 3, Med-Gemini a ďalší: Spôsob, akým AI transformuje zdravotnú starostlivosť v roku 2024

Umelá inteligencia sa v zdravotníctve prejavuje rôznymi spôsobmi, od odhaľovania nových genetických korelácií až po posilnenie robotických chirurgických systémov...

vedieť viac
Čítaj viac
Čítaj viac
Odhalenie budúcnosti GameFi: Šesť inovátorov, ktorí budú dominovať Web3 Herná krajina v roku 2025
Životný štýl Novinová správa Technológia
Odhalenie budúcnosti GameFi: Šesť inovátorov, ktorí budú dominovať Web3 Herná krajina v roku 2025
Januára 13, 2025
Bitfinex: Opatrnosť na kryptom trhu rastie, no bitcoin zostáva odolný
trhy Novinová správa Technológia
Bitfinex: Opatrnosť na kryptom trhu rastie, no bitcoin zostáva odolný
Januára 13, 2025
Napriek nedávnym poklesom a volatilite trhu si odtiene šedej zostávajú istí v dlhodobom býčim výhľade pre krypto
Názor firmy trhy Technológia
Napriek nedávnym poklesom a volatilite trhu si odtiene šedej zostávajú istí v dlhodobom býčim výhľade pre krypto
Januára 13, 2025
UniSat pozastavuje trhové služby CAT20, pretože protokol CAT prechádza aktualizáciou
Novinová správa Technológia
UniSat pozastavuje trhové služby CAT20, pretože protokol CAT prechádza aktualizáciou
Januára 13, 2025
CRYPTOMERIA LABS PTE. LTD.