Vijesti Tehnologija
Rujna 21, 2023

DALL-E 3 Otpuštanje pojačava OpenAIUtjecaj, Odlazak Midjourney i Stable Diffusion Iza

Ukratko

DALL-E 3 je postavljen za besprijekornu integraciju GPT-4, posebno prilagođen za ChatGPT+ pretplatnika.

DALL-E 3 se suzdržava od rekreiranja slika javnih osoba kada se njihova imena eksplicitno spominju.

Vremenski okvir za pristup DALL-E 3 postavljen je za listopad.

OpenAI je predstavio svoju najnoviju kreaciju: DALL-E3. Za razliku od svojih prethodnika, DALL-E 3 fokusiran je na pročišćavanje sitnica, rješavajući probleme poput slova i zamršenih detalja na tijelu, poput prstiju. Rezultat? Niz estetski ugodnih slika bez potrebe za složenim uputama ili zaobilaznim rješenjima.

DALL-E 3 Otpuštanje pojačava OpenAIUtjecaj, Odlazak Midjourney i Stable Diffusion Iza

Važno je napomenuti da ovo izdanje ne dolazi sa sveobuhvatnim skupom pojedinosti o implementaciji, članaka ili API-ja. Umjesto toga, DALL-E 3 je postavljen za besprijekornu integraciju GPT-4, posebno prilagođen za ChatGPT+ pretplatnika.

Ovaj razvoj možda nije seizmička promjena u krajoliku umjetne inteligencije, već prije korak naprijed u suradnji između modela. Mnogi predviđaju da će sljedeći Stable Diffusion model ponudit će još veću sofisticiranost i umjetničku privlačnost.

Da to stavim u kontekst, OpenAINjegovo putovanje kroz generiranje slika umjetnom inteligencijom bilo je prilično naporno:

  • 2021: DALL-E 1, model s 12 milijardi parametara, predstavljen je s ograničenim informacijama.
  • 2021: GLIDE, model s 2 milijarde parametara, predstavljen je zajedno s modelima s otvorenim kodom s 300 milijuna parametara.
  • 2022: Stigao je DALL-E 2 s 2 milijarde parametara, popraćen unCLIP papirom i API-jem.
  • 2023: DALL-E 3 je ušao, i iako bi detalji mogli biti pomalo tajnoviti, jedno je jasno – integrirat će se s GPT-4 za ChatGPT+ pretplatnika.

Od sada, vizualni prikazi DALL-E 3 ostaju pomalo oskudni. Ne postoji baza kodova, post na blogu ili detaljna usporedba s najsuvremenijim (SOTA). OpenAI čini se da svoje karte drže blizu prsa.

DALL-E 3 Otpuštanje pojačava OpenAIUtjecaj, Odlazak Midjourney i Stable Diffusion Iza

Ovaj model se reklamira da posjeduje dublje razumijevanje nijansi i detalja u usporedbi sa svojim prethodnicima. To znači da se očekuje da će prevođenje vaših kreativnih koncepata u vrlo precizne slike biti lakši proces.

Jedno intrigantno obećanje DALL-E 3 je njegova integracija sa ChatGPT. To implicira da se korisnici neće morati boriti s izradom zamršenih upita; kratak opis bi trebao biti dovoljan, sa ChatGPT vješto generiranje detaljnih upita u vaše ime.

OpenAI je također naglasio važnost konteksta u dugim upitima. DALL-E 3 je dizajniran da prihvati opširnost, što ga čini prilagođenijim kontekstu opisanom u opsežnim uputama.

Ipak, kao i kod svakog novog modela umjetne inteligencije, postoji element nepoznatog. Iako prvi pogledi izgledaju obećavajuće, pravi lakmus test doći će s produljenom upotrebom. Ostaju pitanja o njegovoj učinkovitosti i brzini rada.

Vjerojatno će DALL-E 3 biti proces širenja u više faza, sa GPT-4 služi kao koder teksta. Zamršena mehanika ove postavke možda će ostati obavijena velom tajne.

Vremenski okvir za pristup DALL-E 3 postavljen je za listopad, u početku za ChatGPT Plus i ChatGPT Poslovni korisniks, s mogućnošću šireg pristupa za istraživače nakon toga.

povezan: OpenAIAltman u američkom Senatu za raspravu o rizicima AI

nijanse i Cenzura od DALL-E 3

Primarne žarišne točke razvoja DALL-E 3 bile su pedantan proces ograničavanja njegovih mogućnosti. To je uključivalo strogo usklađivanje i filtre dizajnirane za isključivanje određenih vrsta sadržaja. Na primjer, model odlučno odbija generirati slike poznatih ličnosti, replicirati umjetnička djela u stilu poznatih umjetnika ili stvarati bilo kakav sadržaj koji se smatra nesigurnim OpenAIpronicljivim standardima. Ovaj strateški pristup ne odnosi se samo na ograničenja; to je proaktivna mjera usmjerena na zaštitu tvrtke od potencijalnih pravnih zavrzlama.

Ipak, izvan ovih filtara i usklađivanja, neka intrigantna zapažanja izlaze na vidjelo. Čini se da DALL-E 3 pokazuje određenu slabost kada je u pitanju generiranje fotorealističnog sadržaja. Umjesto stvaranja slika koje besprijekorno oponašaju stvarne fotografije, rezultat ima izrazito stiliziranu kvalitetu. Ove slike izrađene umjetnom inteligencijom odišu gotovo renderiranim i pomalo plastičnim izgledom. Čak i kada se izričito traži riječ "fotografija", rezultat ostaje ukorijenjen u svojoj karakterističnoj stilizaciji.

Upit #1
Uputa #1: Fotografija raka pustinjaka smještenog u mokrom pijesku iz velike blizine, s morskom pjenom u blizini i naglašenim detaljima o oklopu i teksturi pijeska.
Upit #2
Zahtjev #2: Živopisni žuti kauč u obliku banane nalazi se u udobnoj dnevnoj sobi, a njegova zakrivljenost privlači hrpu šarenih jastuka. na drvenom podu, tepih s uzorkom dodaje dašak eklektičnog šarma, a biljka u saksiji nalazi se u kutu, dopirući do sunčeve svjetlosti koja se filtrira kroz prozor.
Upit #3
Uputa #3: Fotografija drevnog brodoloma smještenog na dnu oceana. Morske biljke preuzele su drvenu strukturu, a ribe plivaju ui iz njegovih šupljina. Potopljeno blago i stari topovi razbacani su uokolo, pružajući pogled u prošlost.

Vrijedno je napomenuti da usprkos tim posebnostima, DALL-E 3 nudi uvid u izvanredan potencijal. Među njegovim kreacijama, neki primjerci pokazuju nevjerojatnu sličnost s fotografijama. Treba imati na umu da se simulirani realizam ovih slika ne podudara nužno s načinom na koji bi izgledala originalna fotografija istog subjekta, osobito ako je uronjena pod vodu.

povezan: Microsoft je predstavio Designer, prvi profesionalni alat za pretvaranje teksta u sliku temeljen na DALL-E 2

DALL-E 3 značajke i detalji

Uzmimo trenutak da pretražimo piksele i čitamo između redaka kako bismo shvatili što ovaj novi model uistinu nudi.

Umijeće stilizacije: Pogled kroz OpenAIInstagram račun, primijetit ćete obilje umjetnina koje karakterizira izuzetna stilizacija. Iako postoji impresivan niz apstraktnih kompozicija i dizajna, čini se da se model kloni proizvodnje fotorealističnog sadržaja. Ovdje je naglasak na estetici i kreativnosti, a ne na oponašanju stvarnosti.

Umjetnička ograničenja: DALL-E 3 ide drugačijim putem od svog prethodnika. Odlučno odbija stvarati slike u stilu živih umjetnika, što je veliki odmak od DALL-E 2, koji bi mogao imitirati stilove određenih umjetnika. To bi moglo pobuditi obrve u kreativnoj zajednici, slično kao i mlak prijem Stable Diffusion 2.0.

Osnaživanje umjetnika: U nastojanju da se poštuju prava umjetnika, OpenAI omogućuje umjetnicima da isključe svoje radove iz budućih DALL-E verzija. Podnošenjem slike na koju posjeduju prava, umjetnici mogu zatražiti njezino isključivanje iz rezultata modela. Buduće iteracije DALL-E-a tada će izbjeći generiranje sadržaja nalik na stil umjetnika.

Sigurnost i cenzura: OpenAIParanoja o sigurnosti je opipljiva. Surađivali su s vanjskim "crvenim timovima" kako bi testirali sigurnost modela i upotrijebili klasifikatore unosa kako bi naučili model zanemariti određene riječi koje bi mogle dovesti do eksplicitnog ili štetnog sadržaja. DALL-E 3 se suzdržava od ponovnog stvaranja slika javne osobe kada se njihova imena izrijekom spominju. Ostaje neizvjesno spadaju li slavne osobe u ovu kategoriju, što potencijalno utječe na kvalitetu generiranih lica.

Vodeni žigovi i praćenje: Postoji nagovještaj o ugrađivanju oznaka za praćenje "slika generiranih umjetnom inteligencijom", što ukazuje na pomak prema boljem praćenju i potencijalnom označavanju generiranog sadržaja vodenim žigom.

Tekst i ruke poboljšani: OpenAI hvali poboljšano generiranje teksta i ručno iscrtavanje, što je uobičajena tvrdnja među konkurentima. Pravi test leži u stvarnom rezultatu izvan odabranih primjera.

Prostorno razumijevanje: DALL-E 3 ističe se u razumijevanju prostornih odnosa opisanih u uputama. Ovo poboljšava sposobnost modela da konstruira složene kutove i kompozicije, iako korisnici čekaju konkretnije dokaze ovog obećanja.

Snaga upita: Srž DALL-E3 leži u njegovim brzim mogućnostima i integraciji s ChatGPT. Obećava automatizaciju, brzinu i pojednostavljenje brzog dizajna. Ovdje je trend prema chatGPT generiranje upita, prevođenje nejasnih ideja ili rudimentarnih poticaja u elokventne. Poboljšano razumijevanje konteksta DALL-E 3 usmjerava proces, dopuštajući korisnicima da se usredotoče na namjeru umjesto na opširnost.

Neistražene teritorije: Posebno su odsutni iz rasprave aspekti kao što su inpainting, outpainting, generativno ispunjavanje i 3D modeliranje. Nedostatak ovih značajki mogao bi biti ograničenje, posebno za korisnike koji su navikli na svestranije modele.

Pojedinosti o pristupu: DALL-E 3 je postavljen da postane dostupan ChatGPT Plus i Enterprise kupci početkom listopada. Međutim, specifičnosti u pogledu dodjele kredita za ChatGPT Osim toga, korisnici i povezani troškovi ostaju nejasni. Pristup će biti omogućen putem API-ja i OpenAI Platforma Labs "kasnije u jesen."

Uspješnost integracije: DALL-E je postavljen za besprijekornu integraciju u partnerske i Microsoftove proizvode. Očekujte da ćete svjedočiti stvaranju prezentacija, ilustracija, dizajna, logotipa, sve u kontekstu i pojačano uz pomoć ChatGPT. Ova će integracija postati mainstream, predstavljajući značajan izazov za konkurente poput Google sa svojim Bardom i ideogram.

Konvergencija LLM-a i vizualnog sadržaja: Najintrigantniji aspekt leži u konvergenciji velikih jezičnih modela (LLM) i modela generiranja vizualnog sadržaja. Označava pomak od složenog brzog inženjeringa do izražavanja ideja pristupačnijim jezikom. AI će prikupiti kontekst i ideje iz tih izraza, nudeći kreativne mogućnosti kojima je teško odoljeti.

povezan: Top 50 upita za pretvaranje teksta u sliku za AI umjetničke generatore Midjourney i DALL-E

DALL-E 3: Budite novi lider u generaciji AI slike

OpenAIodluku da integrira DALL-E 3 u ChatGPT ekosustav je strateški potez. Ova integracija omogućuje DALL-E 3 pristup velikoj korisničkoj bazi podataka od 100 milijuna aktivnih korisnika. Ovaj korak značajno povećava dostupnost DALL-E 3 i ima potencijal katapultirati njegovu popularnost.

Trenutno, Midjourney i Stable Diffusion hvaliti se okolo 15 milijuna registriranih korisnika. Međutim, s ovom integracijom, DALL-E 3 bi trebao dobiti pristup bazi korisnika deset puta većoj - 100 milijuna korisnika. Ovo čini ChatGPT Plus pretplata plan još privlačniji jer nudi pristup chatbotu, analitičkim alatima i generiranju slika, a sve po pristupačnoj cijeni.

Integracija nije samo korisna za postojeće korisnike, već služi i kao snažan magnet za nove korisnike. Proširuje OpenAI doseg i popularnost ekosustava, privlačeći pojedince koji traže rješenja sadržaja generirana umjetnom inteligencijom.

Ovaj strateški potez je spreman za jačanje OpenAIprihod i druge ključne metrike. Investitori tvrtke vjerojatno će pozitivno gledati na ovaj razvoj događaja, posebno u svjetlu nedavnih 20% pad obima prometa tijekom ljeta.

ChatGPT Web promet pada 20% u rujnu i nastavlja padati

Pročitajte još povezanih tema:

Izjava o odricanju od odgovornosti

U skladu s Smjernice projekta povjerenja, imajte na umu da informacije navedene na ovoj stranici nemaju namjeru i ne smiju se tumačiti kao pravni, porezni, investicijski, financijski ili bilo koji drugi oblik savjeta. Važno je ulagati samo ono što si možete priuštiti izgubiti i potražiti neovisni financijski savjet ako imate bilo kakvih nedoumica. Za dodatne informacije predlažemo da pogledate odredbe i uvjete, kao i stranice za pomoć i podršku koje pruža izdavatelj ili oglašivač. MetaversePost je predan točnom, nepristranom izvješćivanju, ali tržišni uvjeti podložni su promjenama bez prethodne najave.

O autoru

Damir je voditelj tima, product manager i urednik u Metaverse Post, koji pokriva teme kao što su AI/ML, AGI, LLMs, Metaverse i Web3- srodna polja. Njegovi članci privlače ogromnu publiku od preko milijun korisnika svakog mjeseca. Čini se da je stručnjak s 10 godina iskustva u SEO-u i digitalnom marketingu. Damir je spomenut u Mashableu, Wiredu, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i druge publikacije. Putuje između UAE, Turske, Rusije i CIS-a kao digitalni nomad. Damir je stekao diplomu prvostupnika fizike, za koju vjeruje da mu je dala vještine kritičkog razmišljanja potrebne za uspjeh u stalno promjenjivom okruženju interneta. 

Više članaka
Damir Yalalov
Damir Yalalov

Damir je voditelj tima, product manager i urednik u Metaverse Post, koji pokriva teme kao što su AI/ML, AGI, LLMs, Metaverse i Web3- srodna polja. Njegovi članci privlače ogromnu publiku od preko milijun korisnika svakog mjeseca. Čini se da je stručnjak s 10 godina iskustva u SEO-u i digitalnom marketingu. Damir je spomenut u Mashableu, Wiredu, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i druge publikacije. Putuje između UAE, Turske, Rusije i CIS-a kao digitalni nomad. Damir je stekao diplomu prvostupnika fizike, za koju vjeruje da mu je dala vještine kritičkog razmišljanja potrebne za uspjeh u stalno promjenjivom okruženju interneta. 

Od Ripplea do Big Green DAO-a: Kako projekti kriptovaluta pridonose dobrotvornim aktivnostima

Istražimo inicijative koje iskorištavaju potencijal digitalnih valuta u dobrotvorne svrhe.

Znati više

AlphaFold 3, Med-Gemini i drugi: način na koji umjetna inteligencija transformira zdravstvo 2024.

AI se manifestira na različite načine u zdravstvu, od otkrivanja novih genetskih korelacija do osnaživanja robotskih kirurških sustava...

Znati više
Pridružite se našoj zajednici inovativnih tehnologija
opširnije
Čitaj više
Od Ripplea do Big Green DAO-a: Kako projekti kriptovaluta pridonose dobrotvornim aktivnostima
Analiza Kriptovalute Wiki posao Obrazovanje Lifestyle tržišta softver Tehnologija
Od Ripplea do Big Green DAO-a: Kako projekti kriptovaluta pridonose dobrotvornim aktivnostima
Neka 13, 2024
AlphaFold 3, Med-Gemini i drugi: način na koji umjetna inteligencija transformira zdravstvo 2024.
AI Wiki Analiza probaviti Mišljenje posao tržišta Vijesti softver Priče i recenzije Tehnologija
AlphaFold 3, Med-Gemini i drugi: način na koji umjetna inteligencija transformira zdravstvo 2024.
Neka 13, 2024
Mreža Nim za uvođenje okvira za tokenizaciju vlasništva AI i provođenje prodaje prinosa s datumom snimke zakazanim za svibanj
tržišta Vijesti Tehnologija
Mreža Nim za uvođenje okvira za tokenizaciju vlasništva AI i provođenje prodaje prinosa s datumom snimke zakazanim za svibanj
Neka 13, 2024
Binance je partner s Argentinom u borbi protiv kibernetičkog kriminala
Mišljenje posao tržišta Vijesti softver Tehnologija
Binance je partner s Argentinom u borbi protiv kibernetičkog kriminala
Neka 13, 2024
CRYPTOMERIA LABS PTE. LTD.