DALL-E 3 Release Zosilňuje OpenAIVplyv, odchod Midjourney a Stable Diffusion za
Stručne
DALL-E 3 je nastavený na bezproblémovú integráciu GPT-4, špeciálne prispôsobené pre ChatGPT+ predplatiteľov.
DALL-E 3 sa zdržuje vytvárania obrázkov verejných činiteľov, ak sú ich mená výslovne uvedené.
Časová os prístupu k DALL-E 3 je stanovená na október.
OpenAI predstavil svoj najnovší výtvor: DALL-E3. Na rozdiel od svojich predchodcov sa DALL-E 3 zameriava na vylepšovanie detailov, riešenie problémov, ako sú nápisy a zložité detaily tela, ako sú prsty. Výsledok? Množstvo esteticky príjemných obrázkov bez potreby zložitých výziev alebo riešení.
Je dôležité poznamenať, že toto vydanie neprichádza s komplexným súborom podrobností o implementácii, článkov alebo rozhraní API. Namiesto toho je DALL-E 3 nastavený na bezproblémovú integráciu GPT-4, špeciálne prispôsobené pre ChatGPT+ predplatiteľov.
Tento vývoj nemusí byť seizmickým posunom v prostredí AI, ale skôr krokom vpred v spolupráci medzi modelmi. Mnohí predpokladajú, že nabudúce Stable Diffusion model ponúkne ešte väčšiu sofistikovanosť a umeleckú príťažlivosť.
Aby som to uviedol do kontextu, OpenAICesta cez generovanie obrázkov AI bola celkom náročná:
- 2021: DALL-E 1, model s 12 miliardami parametrov, bol predstavený s obmedzenými informáciami.
- 2021: GLIDE, model s 2 miliardami parametrov, bol predstavený spolu s modelmi s otvoreným zdrojom s 300 miliónmi parametrov.
- 2022: Prišiel DALL-E 2 s 2 miliardami parametrov, spolu s papierom unCLIP a API.
- 2023: DALL-E 3 sa dostal na trh a hoci detaily môžu byť trochu záhadné, jedna vec je jasná – bude sa integrovať s GPT-4 pre ChatGPT+ predplatiteľov.
Odteraz je vizuál DALL-E 3 trochu vzácny. Nechýba kódová báza, blogový príspevok ani podrobné porovnanie s najmodernejšou technológiou (SOTA). OpenAI Zdá sa, že karty drží pri hrudi.
Model je propagovaný tak, aby mal v porovnaní so svojimi predchodcami hlbšie pochopenie nuancií a detailov. To znamená, že preklad vašich kreatívnych konceptov do vysoko presných obrázkov bude plynulejší.
Jedným zo zaujímavých prísľubov DALL-E 3 je jeho integrácia s ChatGPT. To znamená, že používatelia sa nebudú musieť potýkať s vytváraním zložitých výziev; mal by stačiť stručný popis, s ChatGPT vhodne generovať podrobné výzvy vo vašom mene.
OpenAI tiež zdôraznil dôležitosť kontextu v dlhých výzvach. DALL-E 3 je navrhnutý tak, aby zahŕňal výrečnosť, vďaka čomu je lepšie prispôsobený kontextu opísanému v rozsiahlych výzvach.
Napriek tomu, ako pri každom novom modeli AI, je tu prvok neznáma. Zatiaľ čo prvé pohľady vyzerajú sľubne, skutočný lakmusový papierik príde s rozšíreným používaním. Otázkou zostáva jeho účinnosť a rýchlosť prevádzky.
Je pravdepodobné, že DALL-E 3 bude viacstupňový proces šírenia, s GPT-4 slúži ako kódovač textu. Zložitá mechanika tohto nastavenia môže zostať zahalená rúškom tajomstva.
Časová os prístupu k DALL-E 3 je stanovená na október, pôvodne na ChatGPT Plus a ChatGPT Podnikový používateľs, s možnosťou širšieho prístupu pre výskumníkov.
nuansy a cenzúra z DALL-E 3
Hlavnými bodmi vývoja DALL-E 3 bol starostlivý proces obmedzovania jeho schopností. To zahŕňalo prísne zarovnanie a filtre navrhnuté tak, aby vylúčili konkrétne typy obsahu. Modelka napríklad rozhodne odmieta vytvárať obrázky známych osobností, replikovať umelecké diela v štýle renomovaných umelcov alebo vytvárať akýkoľvek obsah, ktorý by považovali za nebezpečný. OpenAInáročné štandardy. Tento strategický prístup nie je len o obmedzeniach; je to proaktívne opatrenie zamerané na ochranu spoločnosti pred potenciálnymi právnymi zápletkami.
Okrem týchto filtrov a zarovnaní však vychádzajú na povrch niektoré zaujímavé pozorovania. Zdá sa, že DALL-E 3 vykazuje určitú slabosť, pokiaľ ide o vytváranie fotorealistického obsahu. Namiesto vytvárania obrázkov, ktoré bezchybne napodobňujú skutočné fotografie, výstup prináša výraznú štylizovanú kvalitu. Tieto obrázky vytvorené AI vyžarujú takmer vykreslený a mierne plastický vzhľad. Aj keď je výsledok vyslovene vyzvaný slovom „fotografia“, zostáva zakorenený vo svojej charakteristickej štylizácii.
Stojí za zmienku, že napriek týmto zvláštnostiam ponúka DALL-E 3 pohľad na pozoruhodný potenciál. Medzi jeho výtvormi niektoré prípady vykazujú nápadnú podobnosť s fotografiami. Majte na pamäti, že simulovaný realizmus týchto obrázkov sa nemusí nevyhnutne zhodovať s tým, ako by vyzerala skutočná fotografia toho istého objektu, najmä ak je ponorená pod vodou.
DALL-E 3 Vlastnosti a detaily
Venujme chvíľu preberaniu pixelov a čítaniu medzi riadkami, aby sme pochopili, čo tento nový model skutočne ponúka.
Umenie štylizácie: Pohľad cez OpenAIinstagramový účet používateľa, všimnete si množstvo umeleckých diel charakterizovaných vynikajúcou štylizáciou. Aj keď existuje pôsobivá škála abstraktných kompozícií a dizajnov, zdá sa, že model sa vyhýba vytváraniu fotorealistického obsahu. Dôraz je tu kladený na estetiku a kreativitu, nie na napodobňovanie reality.
Umelecké obmedzenia: DALL-E 3 ide inou cestou ako jeho predchodca. Rozhodne odmieta vytvárať obrazy v štýle žijúcich umelcov, čo je výrazný odklon od DALL-E 2, ktorý by mohol napodobňovať štýly určitých umelcov. To by mohlo zdvihnúť obočie v kreatívnej komunite, podobne ako vlažný príjem Stable Diffusion 2.0.
Posilnenie umelcov: V snahe rešpektovať práva umelcov, OpenAI umožňuje umelcom vylúčiť svoju prácu z budúcich verzií DALL-E. Odoslaním obrázka, na ktorý vlastnia práva, môžu umelci požiadať o jeho vylúčenie z výstupu modelu. Budúce iterácie DALL-E sa potom vyhnú generovaniu obsahu podobného štýl umelca.
Bezpečnosť a cenzúra: OpenAIParanoja o bezpečnosti je hmatateľná. Spolupracovali s externými „červenými tímami“ na testovaní bezpečnosti modelu a použili vstupné klasifikátory, aby naučili model ignorovať konkrétne slová, ktoré by mohli viesť k explicitnému alebo škodlivému obsahu. DALL-E 3 sa zdrží opätovného vytvárania obrázkov verejné osobnosti keď sú výslovne uvedené ich mená. Či celebrity patria do tejto kategórie, zostáva neisté, čo môže mať vplyv na kvalitu generovaných tvárí.
Vodoznaky a sledovanie: Existuje náznak vkladania značiek na sledovanie „obrázkov generovaných AI“, čo naznačuje posun smerom k lepšiemu monitorovaniu a potenciálnemu vodoznaku generovaného obsahu.
Text a ruky vylepšené: OpenAI ponúka vylepšené generovanie textu a ručné vykresľovanie, čo je bežné tvrdenie medzi konkurentmi. Skutočný test spočíva v skutočnom výstupe nad rámec vybraných príkladov.
Priestorové porozumenie: DALL-E 3 vyniká v chápaní priestorových vzťahov opísaných vo výzvach. To zlepšuje schopnosť modelu konštruovať zložité uhly a kompozície, hoci používatelia čakajú na konkrétnejšie dôkazy tohto sľubu.
Sila výziev: Základom DALL-E3 spočíva v jeho rýchlych schopnostiach a integrácii s ChatGPT. Sľubuje automatizáciu, rýchlosť a zjednodušenie rýchleho návrhu. Trend tu smeruje k chatGPT generovanie výziev, prekladanie nejasných myšlienok alebo základných podnetov do výrečných. Zlepšené kontextové chápanie DALL-E 3 zefektívňuje proces a umožňuje používateľom sústrediť sa na zámer nad výrečnosťou.
Neprebádané územia: V diskusii výrazne chýbajú aspekty ako premaľovanie, premaľovanie, generatívna výplň a 3D modelovanie. Absencia týchto funkcií by mohla byť obmedzením najmä pre používateľov zvyknutých na všestrannejšie modely.
Podrobnosti prístupu: DALL-E 3 je nastavený tak, aby bol dostupný pre ChatGPT Zákazníci Plus a Enterprise začiatkom októbra. Avšak špecifiká ohľadom prideľovania kreditov za ChatGPT Plus používatelia a súvisiace náklady zostávajú nejasné. Prístup bude poskytovaný cez API a OpenAI Platforma Labs „neskôr na jeseň“.
Schopnosť integrácie: DALL-E je pripravený na bezproblémovú integráciu do produktov partnerov a Microsoftu. Očakávajte, že budete svedkami vytvárania prezentácií, ilustrácií, návrhov, log, všetko v kontexte a zosilnené s pomocou od ChatGPT. Táto integrácia sa má stať hlavným prúdom, čo predstavuje značnú výzvu pre konkurentov, ako sú Google so svojím Bardom a Ideogram.
Konvergencia LLM a vizuálneho obsahu: Najzaujímavejší aspekt spočíva v konvergencii veľkých jazykových modelov (LLM) a modelov generovania vizuálneho obsahu. Znamená to posun od komplexného rýchleho inžinierstva k vyjadrovaniu myšlienok prístupnejším jazykom. Umelá inteligencia získa kontext a nápady z týchto výrazov a ponúkne kreatívne možnosti, ktorým je ťažké odolať.
príbuzný: 50 najlepších výziev na prevod textu na obrázok pre generátory umenia AI Midjourney a DALL-E |
DALL-E 3: Staňte sa novým lídrom vo vytváraní AI obrázkov
OpenAIrozhodnutie integrovať DALL-E 3 do ChatGPT ekosystém je strategický krok. Táto integrácia poskytuje DALL-E 3 prístup k rozsiahlej databáze používateľov so 100 miliónmi aktívnych používateľov. Tento krok výrazne zlepšuje dostupnosť DALL-E 3 a má potenciál katapultovať jeho popularitu.
V súčasnej dobe, Midjourney a Stable Diffusion chváliť sa okolo seba 15 miliónov registrovaných používateľov. Vďaka tejto integrácii je však DALL-E 3 nastavený tak, aby získal prístup k desaťkrát väčšej používateľskej základni – 100 miliónom používateľov. Toto robí ChatGPT Plus predplatné plán je o to príťažlivejší, pretože ponúka prístup k chatbotovi, analytickým nástrojom a generovaniu obrázkov, a to všetko za prijateľnú cenu.
Integrácia je výhodná nielen pre existujúcich používateľov, ale slúži aj ako silný magnet pre nových používateľov. Rozširuje to OpenAI dosah a popularita ekosystému, ktorá priťahuje jednotlivcov, ktorí hľadajú riešenia obsahu vytvorené umelou inteligenciou.
Tento strategický krok je pripravený podporiť OpenAIvýnosy a ďalšie kľúčové metriky. Investori spoločnosti budú pravdepodobne vnímať tento vývoj priaznivo, najmä vo svetle nedávnych udalostí 20% pokles objemu dopravy v lete.
Prečítajte si ďalšie súvisiace témy:
Vylúčenie zodpovednosti
V súlade s Pokyny k projektu Trust, uvedomte si, že informácie uvedené na tejto stránke nie sú zamýšľané a nemali by byť interpretované ako právne, daňové, investičné, finančné alebo iné formy poradenstva. Je dôležité investovať len toľko, koľko si môžete dovoliť stratiť a v prípade akýchkoľvek pochybností vyhľadať nezávislé finančné poradenstvo. Ak chcete získať ďalšie informácie, odporúčame vám pozrieť si zmluvné podmienky, ako aj stránky pomoci a podpory poskytnuté vydavateľom alebo inzerentom. MetaversePost sa zaviazala poskytovať presné a nezaujaté správy, ale podmienky na trhu sa môžu zmeniť bez upozornenia.
O autorovi
Damir je vedúci tímu, produktový manažér a redaktor v Metaverse Post, pokrývajúce témy ako AI/ML, AGI, LLM, Metaverse a Web3- súvisiace oblasti. Jeho články priťahujú každý mesiac obrovské publikum s viac ako miliónom používateľov. Zdá sa, že je odborníkom s 10-ročnými skúsenosťami v oblasti SEO a digitálneho marketingu. Damir bol spomenutý v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a ďalšie publikácie. Ako digitálny nomád cestuje medzi SAE, Tureckom, Ruskom a SNŠ. Damir získal bakalársky titul z fyziky, o ktorom sa domnieva, že mu dal schopnosti kritického myslenia potrebné na to, aby bol úspešný v neustále sa meniacom prostredí internetu.
Ďalšie článkyDamir je vedúci tímu, produktový manažér a redaktor v Metaverse Post, pokrývajúce témy ako AI/ML, AGI, LLM, Metaverse a Web3- súvisiace oblasti. Jeho články priťahujú každý mesiac obrovské publikum s viac ako miliónom používateľov. Zdá sa, že je odborníkom s 10-ročnými skúsenosťami v oblasti SEO a digitálneho marketingu. Damir bol spomenutý v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a ďalšie publikácie. Ako digitálny nomád cestuje medzi SAE, Tureckom, Ruskom a SNŠ. Damir získal bakalársky titul z fyziky, o ktorom sa domnieva, že mu dal schopnosti kritického myslenia potrebné na to, aby bol úspešný v neustále sa meniacom prostredí internetu.