Novinová správa Technológia
September 21, 2023

DALL-E 3 Release Zosilňuje OpenAIVplyv, odchod Midjourney a Stable Diffusion za

Stručne

DALL-E 3 je nastavený na bezproblémovú integráciu GPT-4, špeciálne prispôsobené pre ChatGPT+ predplatiteľov.

DALL-E 3 sa zdržuje vytvárania obrázkov verejných činiteľov, ak sú ich mená výslovne uvedené.

Časová os prístupu k DALL-E 3 je stanovená na október.

OpenAI predstavil svoj najnovší výtvor: DALL-E3. Na rozdiel od svojich predchodcov sa DALL-E 3 zameriava na vylepšovanie detailov, riešenie problémov, ako sú nápisy a zložité detaily tela, ako sú prsty. Výsledok? Množstvo esteticky príjemných obrázkov bez potreby zložitých výziev alebo riešení.

DALL-E 3 Release Zosilňuje OpenAIVplyv, odchod Midjourney a Stable Diffusion za

Je dôležité poznamenať, že toto vydanie neprichádza s komplexným súborom podrobností o implementácii, článkov alebo rozhraní API. Namiesto toho je DALL-E 3 nastavený na bezproblémovú integráciu GPT-4, špeciálne prispôsobené pre ChatGPT+ predplatiteľov.

Tento vývoj nemusí byť seizmickým posunom v prostredí AI, ale skôr krokom vpred v spolupráci medzi modelmi. Mnohí predpokladajú, že nabudúce Stable Diffusion model ponúkne ešte väčšiu sofistikovanosť a umeleckú príťažlivosť.

Aby som to uviedol do kontextu, OpenAICesta cez generovanie obrázkov AI bola celkom náročná:

  • 2021: DALL-E 1, model s 12 miliardami parametrov, bol predstavený s obmedzenými informáciami.
  • 2021: GLIDE, model s 2 miliardami parametrov, bol predstavený spolu s modelmi s otvoreným zdrojom s 300 miliónmi parametrov.
  • 2022: Prišiel DALL-E 2 s 2 miliardami parametrov, spolu s papierom unCLIP a API.
  • 2023: DALL-E 3 sa dostal na trh a hoci detaily môžu byť trochu záhadné, jedna vec je jasná – bude sa integrovať s GPT-4 pre ChatGPT+ predplatiteľov.

Odteraz je vizuál DALL-E 3 trochu vzácny. Nechýba kódová báza, blogový príspevok ani podrobné porovnanie s najmodernejšou technológiou (SOTA). OpenAI Zdá sa, že karty drží pri hrudi.

DALL-E 3 Release Zosilňuje OpenAIVplyv, odchod Midjourney a Stable Diffusion za

Model je propagovaný tak, aby mal v porovnaní so svojimi predchodcami hlbšie pochopenie nuancií a detailov. To znamená, že preklad vašich kreatívnych konceptov do vysoko presných obrázkov bude plynulejší.

Jedným zo zaujímavých prísľubov DALL-E 3 je jeho integrácia s ChatGPT. To znamená, že používatelia sa nebudú musieť potýkať s vytváraním zložitých výziev; mal by stačiť stručný popis, s ChatGPT vhodne generovať podrobné výzvy vo vašom mene.

OpenAI tiež zdôraznil dôležitosť kontextu v dlhých výzvach. DALL-E 3 je navrhnutý tak, aby zahŕňal výrečnosť, vďaka čomu je lepšie prispôsobený kontextu opísanému v rozsiahlych výzvach.

Napriek tomu, ako pri každom novom modeli AI, je tu prvok neznáma. Zatiaľ čo prvé pohľady vyzerajú sľubne, skutočný lakmusový papierik príde s rozšíreným používaním. Otázkou zostáva jeho účinnosť a rýchlosť prevádzky.

Je pravdepodobné, že DALL-E 3 bude viacstupňový proces šírenia, s GPT-4 slúži ako kódovač textu. Zložitá mechanika tohto nastavenia môže zostať zahalená rúškom tajomstva.

Časová os prístupu k DALL-E 3 je stanovená na október, pôvodne na ChatGPT Plus a ChatGPT Podnikový používateľs, s možnosťou širšieho prístupu pre výskumníkov.

príbuzný: OpenAIAltman v Senáte USA, aby diskutoval o rizikách AI

nuansy a cenzúra z DALL-E 3

Hlavnými bodmi vývoja DALL-E 3 bol starostlivý proces obmedzovania jeho schopností. To zahŕňalo prísne zarovnanie a filtre navrhnuté tak, aby vylúčili konkrétne typy obsahu. Modelka napríklad rozhodne odmieta vytvárať obrázky známych osobností, replikovať umelecké diela v štýle renomovaných umelcov alebo vytvárať akýkoľvek obsah, ktorý by považovali za nebezpečný. OpenAInáročné štandardy. Tento strategický prístup nie je len o obmedzeniach; je to proaktívne opatrenie zamerané na ochranu spoločnosti pred potenciálnymi právnymi zápletkami.

Okrem týchto filtrov a zarovnaní však vychádzajú na povrch niektoré zaujímavé pozorovania. Zdá sa, že DALL-E 3 vykazuje určitú slabosť, pokiaľ ide o vytváranie fotorealistického obsahu. Namiesto vytvárania obrázkov, ktoré bezchybne napodobňujú skutočné fotografie, výstup prináša výraznú štylizovanú kvalitu. Tieto obrázky vytvorené AI vyžarujú takmer vykreslený a mierne plastický vzhľad. Aj keď je výsledok vyslovene vyzvaný slovom „fotografia“, zostáva zakorenený vo svojej charakteristickej štylizácii.

Výzva č. 1
Výzva č. 1: Detailná fotografia kraba pustovníka usadeného vo vlhkom piesku s morskou penou v blízkosti a zvýraznenými detailmi jeho panciera a textúry piesku.
Výzva č. 2
Výzva č. 2: Žiarivá žltá pohovka v tvare banánu sa nachádza v útulnej obývačke a jej krivka kolíše nad hromadou farebných vankúšov. na drevenej podlahe dodáva vzorovaný koberec nádych eklektického šarmu a v rohu je umiestnená rastlina v črepníkoch, ktorá siaha k slnečnému svetlu filtrujúcemu cez okno.
Výzva č. 3
Výzva č. 3: Fotografia starovekého vraku lode uhniezdeného na dne oceánu. Morské rastliny si nárokovali drevenú konštrukciu a ryby plávajú do a von z jej dutých priestorov. Okolo sú roztrúsené potopené poklady a staré delá, ktoré poskytujú pohľad do minulosti.

Stojí za zmienku, že napriek týmto zvláštnostiam ponúka DALL-E 3 pohľad na pozoruhodný potenciál. Medzi jeho výtvormi niektoré prípady vykazujú nápadnú podobnosť s fotografiami. Majte na pamäti, že simulovaný realizmus týchto obrázkov sa nemusí nevyhnutne zhodovať s tým, ako by vyzerala skutočná fotografia toho istého objektu, najmä ak je ponorená pod vodou.

príbuzný: Microsoft predstavil Designer, prvý profesionálny nástroj na prevod textu na obrázok založený na DALL-E 2

DALL-E 3 Vlastnosti a detaily

Venujme chvíľu preberaniu pixelov a čítaniu medzi riadkami, aby sme pochopili, čo tento nový model skutočne ponúka.

Umenie štylizácie: Pohľad cez OpenAIinstagramový účet používateľa, všimnete si množstvo umeleckých diel charakterizovaných vynikajúcou štylizáciou. Aj keď existuje pôsobivá škála abstraktných kompozícií a dizajnov, zdá sa, že model sa vyhýba vytváraniu fotorealistického obsahu. Dôraz je tu kladený na estetiku a kreativitu, nie na napodobňovanie reality.

Umelecké obmedzenia: DALL-E 3 ide inou cestou ako jeho predchodca. Rozhodne odmieta vytvárať obrazy v štýle žijúcich umelcov, čo je výrazný odklon od DALL-E 2, ktorý by mohol napodobňovať štýly určitých umelcov. To by mohlo zdvihnúť obočie v kreatívnej komunite, podobne ako vlažný príjem Stable Diffusion 2.0.

Posilnenie umelcov: V snahe rešpektovať práva umelcov, OpenAI umožňuje umelcom vylúčiť svoju prácu z budúcich verzií DALL-E. Odoslaním obrázka, na ktorý vlastnia práva, môžu umelci požiadať o jeho vylúčenie z výstupu modelu. Budúce iterácie DALL-E sa potom vyhnú generovaniu obsahu podobného štýl umelca.

Bezpečnosť a cenzúra: OpenAIParanoja o bezpečnosti je hmatateľná. Spolupracovali s externými „červenými tímami“ na testovaní bezpečnosti modelu a použili vstupné klasifikátory, aby naučili model ignorovať konkrétne slová, ktoré by mohli viesť k explicitnému alebo škodlivému obsahu. DALL-E 3 sa zdrží opätovného vytvárania obrázkov verejné osobnosti keď sú výslovne uvedené ich mená. Či celebrity patria do tejto kategórie, zostáva neisté, čo môže mať vplyv na kvalitu generovaných tvárí.

Vodoznaky a sledovanie: Existuje náznak vkladania značiek na sledovanie „obrázkov generovaných AI“, čo naznačuje posun smerom k lepšiemu monitorovaniu a potenciálnemu vodoznaku generovaného obsahu.

Text a ruky vylepšené: OpenAI ponúka vylepšené generovanie textu a ručné vykresľovanie, čo je bežné tvrdenie medzi konkurentmi. Skutočný test spočíva v skutočnom výstupe nad rámec vybraných príkladov.

Priestorové porozumenie: DALL-E 3 vyniká v chápaní priestorových vzťahov opísaných vo výzvach. To zlepšuje schopnosť modelu konštruovať zložité uhly a kompozície, hoci používatelia čakajú na konkrétnejšie dôkazy tohto sľubu.

Sila výziev: Základom DALL-E3 spočíva v jeho rýchlych schopnostiach a integrácii s ChatGPT. Sľubuje automatizáciu, rýchlosť a zjednodušenie rýchleho návrhu. Trend tu smeruje k chatGPT generovanie výziev, prekladanie nejasných myšlienok alebo základných podnetov do výrečných. Zlepšené kontextové chápanie DALL-E 3 zefektívňuje proces a umožňuje používateľom sústrediť sa na zámer nad výrečnosťou.

Neprebádané územia: V diskusii výrazne chýbajú aspekty ako premaľovanie, premaľovanie, generatívna výplň a 3D modelovanie. Absencia týchto funkcií by mohla byť obmedzením najmä pre používateľov zvyknutých na všestrannejšie modely.

Podrobnosti prístupu: DALL-E 3 je nastavený tak, aby bol dostupný pre ChatGPT Zákazníci Plus a Enterprise začiatkom októbra. Avšak špecifiká ohľadom prideľovania kreditov za ChatGPT Plus používatelia a súvisiace náklady zostávajú nejasné. Prístup bude poskytovaný cez API a OpenAI Platforma Labs „neskôr na jeseň“.

Schopnosť integrácie: DALL-E je pripravený na bezproblémovú integráciu do produktov partnerov a Microsoftu. Očakávajte, že budete svedkami vytvárania prezentácií, ilustrácií, návrhov, log, všetko v kontexte a zosilnené s pomocou od ChatGPT. Táto integrácia sa má stať hlavným prúdom, čo predstavuje značnú výzvu pre konkurentov, ako sú Google so svojím Bardom a Ideogram.

Konvergencia LLM a vizuálneho obsahu: Najzaujímavejší aspekt spočíva v konvergencii veľkých jazykových modelov (LLM) a modelov generovania vizuálneho obsahu. Znamená to posun od komplexného rýchleho inžinierstva k vyjadrovaniu myšlienok prístupnejším jazykom. Umelá inteligencia získa kontext a nápady z týchto výrazov a ponúkne kreatívne možnosti, ktorým je ťažké odolať.

príbuzný: 50 najlepších výziev na prevod textu na obrázok pre generátory umenia AI Midjourney a DALL-E

DALL-E 3: Staňte sa novým lídrom vo vytváraní AI obrázkov

OpenAIrozhodnutie integrovať DALL-E 3 do ChatGPT ekosystém je strategický krok. Táto integrácia poskytuje DALL-E 3 prístup k rozsiahlej databáze používateľov so 100 miliónmi aktívnych používateľov. Tento krok výrazne zlepšuje dostupnosť DALL-E 3 a má potenciál katapultovať jeho popularitu.

V súčasnej dobe, Midjourney a Stable Diffusion chváliť sa okolo seba 15 miliónov registrovaných používateľov. Vďaka tejto integrácii je však DALL-E 3 nastavený tak, aby získal prístup k desaťkrát väčšej používateľskej základni – 100 miliónom používateľov. Toto robí ChatGPT Plus predplatné plán je o to príťažlivejší, pretože ponúka prístup k chatbotovi, analytickým nástrojom a generovaniu obrázkov, a to všetko za prijateľnú cenu.

Integrácia je výhodná nielen pre existujúcich používateľov, ale slúži aj ako silný magnet pre nových používateľov. Rozširuje to OpenAI dosah a popularita ekosystému, ktorá priťahuje jednotlivcov, ktorí hľadajú riešenia obsahu vytvorené umelou inteligenciou.

Tento strategický krok je pripravený podporiť OpenAIvýnosy a ďalšie kľúčové metriky. Investori spoločnosti budú pravdepodobne vnímať tento vývoj priaznivo, najmä vo svetle nedávnych udalostí 20% pokles objemu dopravy v lete.

ChatGPT Návštevnosť webu v septembri klesá o 20 % a naďalej klesá

Prečítajte si ďalšie súvisiace témy:

Vylúčenie zodpovednosti

V súlade s Pokyny k projektu Trust, uvedomte si, že informácie uvedené na tejto stránke nie sú zamýšľané a nemali by byť interpretované ako právne, daňové, investičné, finančné alebo iné formy poradenstva. Je dôležité investovať len toľko, koľko si môžete dovoliť stratiť a v prípade akýchkoľvek pochybností vyhľadať nezávislé finančné poradenstvo. Ak chcete získať ďalšie informácie, odporúčame vám pozrieť si zmluvné podmienky, ako aj stránky pomoci a podpory poskytnuté vydavateľom alebo inzerentom. MetaversePost sa zaviazala poskytovať presné a nezaujaté správy, ale podmienky na trhu sa môžu zmeniť bez upozornenia.

O autorovi

Damir je vedúci tímu, produktový manažér a redaktor v Metaverse Post, pokrývajúce témy ako AI/ML, AGI, LLM, Metaverse a Web3- súvisiace oblasti. Jeho články priťahujú každý mesiac obrovské publikum s viac ako miliónom používateľov. Zdá sa, že je odborníkom s 10-ročnými skúsenosťami v oblasti SEO a digitálneho marketingu. Damir bol spomenutý v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a ďalšie publikácie. Ako digitálny nomád cestuje medzi SAE, Tureckom, Ruskom a SNŠ. Damir získal bakalársky titul z fyziky, o ktorom sa domnieva, že mu dal schopnosti kritického myslenia potrebné na to, aby bol úspešný v neustále sa meniacom prostredí internetu. 

Ďalšie články
Damir Yalalov
Damir Yalalov

Damir je vedúci tímu, produktový manažér a redaktor v Metaverse Post, pokrývajúce témy ako AI/ML, AGI, LLM, Metaverse a Web3- súvisiace oblasti. Jeho články priťahujú každý mesiac obrovské publikum s viac ako miliónom používateľov. Zdá sa, že je odborníkom s 10-ročnými skúsenosťami v oblasti SEO a digitálneho marketingu. Damir bol spomenutý v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a ďalšie publikácie. Ako digitálny nomád cestuje medzi SAE, Tureckom, Ruskom a SNŠ. Damir získal bakalársky titul z fyziky, o ktorom sa domnieva, že mu dal schopnosti kritického myslenia potrebné na to, aby bol úspešný v neustále sa meniacom prostredí internetu. 

Hot Stories
Pridajte sa k nášmu newsletteru.
Novinky

Od zvlnenia k veľkému zelenému DAO: Ako kryptomenové projekty prispievajú k charite

Poďme preskúmať iniciatívy, ktoré využívajú potenciál digitálnych mien na charitatívne účely.

vedieť viac

AlphaFold 3, Med-Gemini a ďalší: Spôsob, akým AI transformuje zdravotnú starostlivosť v roku 2024

Umelá inteligencia sa v zdravotníctve prejavuje rôznymi spôsobmi, od odhaľovania nových genetických korelácií až po posilnenie robotických chirurgických systémov...

vedieť viac
Pripojte sa k našej komunite inovatívnych technológií
Čítaj viac
Čítaj viac
Durian odhalený: Komplexná analýza kybernetického arzenálu kryptomien Kimsuky a jeho vplyv na juhokórejské kryptomeny
trhy Softvér Príbehy a recenzie Technológia
Durian odhalený: Komplexná analýza kybernetického arzenálu kryptomien Kimsuky a jeho vplyv na juhokórejské kryptomeny
Môže 14, 2024
Vitalik Buterin zverejňuje návrh EIP-7706 na zavedenie nového typu plynu pre calldata transakcie Ethereum
Novinová správa Technológia
Vitalik Buterin zverejňuje návrh EIP-7706 na zavedenie nového typu plynu pre calldata transakcie Ethereum
Môže 14, 2024
Token WLD spoločnosti Worldcoin bude čeliť agresívnemu predajnému tlaku s ďalšími odomknutiami v nasledujúcich mesiacoch, varuje DeFi2 Bybit Trader
trhy Novinová správa Technológia
Token WLD spoločnosti Worldcoin bude čeliť agresívnemu predajnému tlaku s ďalšími odomknutiami v nasledujúcich mesiacoch, varuje DeFi2 Bybit Trader
Môže 14, 2024
Zážitky z krypto výmeny Coinbase Zlyhanie systému, fondy používateľov sú zabezpečené podvodom Spoločnosť vyšetruje problém
trhy Novinová správa Technológia
Zážitky z krypto výmeny Coinbase Zlyhanie systému, fondy používateľov sú zabezpečené podvodom Spoločnosť vyšetruje problém
Môže 14, 2024
CRYPTOMERIA LABS PTE. LTD.