DALL-E 3 Otpuštanje pojačava OpenAIUtjecaj, Odlazak Midjourney i Stable Diffusion Iza
Ukratko
DALL-E 3 je postavljen za besprijekornu integraciju GPT-4, posebno prilagođen za ChatGPT+ pretplatnika.
DALL-E 3 se suzdržava od rekreiranja slika javnih osoba kada se njihova imena eksplicitno spominju.
Vremenski okvir za pristup DALL-E 3 postavljen je za listopad.
OpenAI je predstavio svoju najnoviju kreaciju: DALL-E3. Za razliku od svojih prethodnika, DALL-E 3 fokusiran je na pročišćavanje sitnica, rješavajući probleme poput slova i zamršenih detalja na tijelu, poput prstiju. Rezultat? Niz estetski ugodnih slika bez potrebe za složenim uputama ili zaobilaznim rješenjima.
Važno je napomenuti da ovo izdanje ne dolazi sa sveobuhvatnim skupom pojedinosti o implementaciji, članaka ili API-ja. Umjesto toga, DALL-E 3 je postavljen za besprijekornu integraciju GPT-4, posebno prilagođen za ChatGPT+ pretplatnika.
Ovaj razvoj možda nije seizmička promjena u krajoliku umjetne inteligencije, već prije korak naprijed u suradnji između modela. Mnogi predviđaju da će sljedeći Stable Diffusion model ponudit će još veću sofisticiranost i umjetničku privlačnost.
Da to stavim u kontekst, OpenAINjegovo putovanje kroz generiranje slika umjetnom inteligencijom bilo je prilično naporno:
- 2021: DALL-E 1, model s 12 milijardi parametara, predstavljen je s ograničenim informacijama.
- 2021: GLIDE, model s 2 milijarde parametara, predstavljen je zajedno s modelima s otvorenim kodom s 300 milijuna parametara.
- 2022: Stigao je DALL-E 2 s 2 milijarde parametara, popraćen unCLIP papirom i API-jem.
- 2023: DALL-E 3 je ušao, i iako bi detalji mogli biti pomalo tajnoviti, jedno je jasno – integrirat će se s GPT-4 za ChatGPT+ pretplatnika.
Od sada, vizualni prikazi DALL-E 3 ostaju pomalo oskudni. Ne postoji baza kodova, post na blogu ili detaljna usporedba s najsuvremenijim (SOTA). OpenAI čini se da svoje karte drže blizu prsa.
Ovaj model se reklamira da posjeduje dublje razumijevanje nijansi i detalja u usporedbi sa svojim prethodnicima. To znači da se očekuje da će prevođenje vaših kreativnih koncepata u vrlo precizne slike biti lakši proces.
Jedno intrigantno obećanje DALL-E 3 je njegova integracija sa ChatGPT. To implicira da se korisnici neće morati boriti s izradom zamršenih upita; kratak opis bi trebao biti dovoljan, sa ChatGPT vješto generiranje detaljnih upita u vaše ime.
OpenAI je također naglasio važnost konteksta u dugim upitima. DALL-E 3 je dizajniran da prihvati opširnost, što ga čini prilagođenijim kontekstu opisanom u opsežnim uputama.
Ipak, kao i kod svakog novog modela umjetne inteligencije, postoji element nepoznatog. Iako prvi pogledi izgledaju obećavajuće, pravi lakmus test doći će s produljenom upotrebom. Ostaju pitanja o njegovoj učinkovitosti i brzini rada.
Vjerojatno će DALL-E 3 biti proces širenja u više faza, sa GPT-4 služi kao koder teksta. Zamršena mehanika ove postavke možda će ostati obavijena velom tajne.
Vremenski okvir za pristup DALL-E 3 postavljen je za listopad, u početku za ChatGPT Plus i ChatGPT Poslovni korisniks, s mogućnošću šireg pristupa za istraživače nakon toga.
nijanse i Cenzura od DALL-E 3
Primarne žarišne točke razvoja DALL-E 3 bile su pedantan proces ograničavanja njegovih mogućnosti. To je uključivalo strogo usklađivanje i filtre dizajnirane za isključivanje određenih vrsta sadržaja. Na primjer, model odlučno odbija generirati slike poznatih ličnosti, replicirati umjetnička djela u stilu poznatih umjetnika ili stvarati bilo kakav sadržaj koji se smatra nesigurnim OpenAIpronicljivim standardima. Ovaj strateški pristup ne odnosi se samo na ograničenja; to je proaktivna mjera usmjerena na zaštitu tvrtke od potencijalnih pravnih zavrzlama.
Ipak, izvan ovih filtara i usklađivanja, neka intrigantna zapažanja izlaze na vidjelo. Čini se da DALL-E 3 pokazuje određenu slabost kada je u pitanju generiranje fotorealističnog sadržaja. Umjesto stvaranja slika koje besprijekorno oponašaju stvarne fotografije, rezultat ima izrazito stiliziranu kvalitetu. Ove slike izrađene umjetnom inteligencijom odišu gotovo renderiranim i pomalo plastičnim izgledom. Čak i kada se izričito traži riječ "fotografija", rezultat ostaje ukorijenjen u svojoj karakterističnoj stilizaciji.
Vrijedno je napomenuti da usprkos tim posebnostima, DALL-E 3 nudi uvid u izvanredan potencijal. Među njegovim kreacijama, neki primjerci pokazuju nevjerojatnu sličnost s fotografijama. Treba imati na umu da se simulirani realizam ovih slika ne podudara nužno s načinom na koji bi izgledala originalna fotografija istog subjekta, osobito ako je uronjena pod vodu.
DALL-E 3 značajke i detalji
Uzmimo trenutak da pretražimo piksele i čitamo između redaka kako bismo shvatili što ovaj novi model uistinu nudi.
Umijeće stilizacije: Pogled kroz OpenAIInstagram račun, primijetit ćete obilje umjetnina koje karakterizira izuzetna stilizacija. Iako postoji impresivan niz apstraktnih kompozicija i dizajna, čini se da se model kloni proizvodnje fotorealističnog sadržaja. Ovdje je naglasak na estetici i kreativnosti, a ne na oponašanju stvarnosti.
Umjetnička ograničenja: DALL-E 3 ide drugačijim putem od svog prethodnika. Odlučno odbija stvarati slike u stilu živih umjetnika, što je veliki odmak od DALL-E 2, koji bi mogao imitirati stilove određenih umjetnika. To bi moglo pobuditi obrve u kreativnoj zajednici, slično kao i mlak prijem Stable Diffusion 2.0.
Osnaživanje umjetnika: U nastojanju da se poštuju prava umjetnika, OpenAI omogućuje umjetnicima da isključe svoje radove iz budućih DALL-E verzija. Podnošenjem slike na koju posjeduju prava, umjetnici mogu zatražiti njezino isključivanje iz rezultata modela. Buduće iteracije DALL-E-a tada će izbjeći generiranje sadržaja nalik na stil umjetnika.
Sigurnost i cenzura: OpenAIParanoja o sigurnosti je opipljiva. Surađivali su s vanjskim "crvenim timovima" kako bi testirali sigurnost modela i upotrijebili klasifikatore unosa kako bi naučili model zanemariti određene riječi koje bi mogle dovesti do eksplicitnog ili štetnog sadržaja. DALL-E 3 se suzdržava od ponovnog stvaranja slika javne osobe kada se njihova imena izrijekom spominju. Ostaje neizvjesno spadaju li slavne osobe u ovu kategoriju, što potencijalno utječe na kvalitetu generiranih lica.
Vodeni žigovi i praćenje: Postoji nagovještaj o ugrađivanju oznaka za praćenje "slika generiranih umjetnom inteligencijom", što ukazuje na pomak prema boljem praćenju i potencijalnom označavanju generiranog sadržaja vodenim žigom.
Tekst i ruke poboljšani: OpenAI hvali poboljšano generiranje teksta i ručno iscrtavanje, što je uobičajena tvrdnja među konkurentima. Pravi test leži u stvarnom rezultatu izvan odabranih primjera.
Prostorno razumijevanje: DALL-E 3 ističe se u razumijevanju prostornih odnosa opisanih u uputama. Ovo poboljšava sposobnost modela da konstruira složene kutove i kompozicije, iako korisnici čekaju konkretnije dokaze ovog obećanja.
Snaga upita: Srž DALL-E3 leži u njegovim brzim mogućnostima i integraciji s ChatGPT. Obećava automatizaciju, brzinu i pojednostavljenje brzog dizajna. Ovdje je trend prema chatGPT generiranje upita, prevođenje nejasnih ideja ili rudimentarnih poticaja u elokventne. Poboljšano razumijevanje konteksta DALL-E 3 usmjerava proces, dopuštajući korisnicima da se usredotoče na namjeru umjesto na opširnost.
Neistražene teritorije: Posebno su odsutni iz rasprave aspekti kao što su inpainting, outpainting, generativno ispunjavanje i 3D modeliranje. Nedostatak ovih značajki mogao bi biti ograničenje, posebno za korisnike koji su navikli na svestranije modele.
Pojedinosti o pristupu: DALL-E 3 je postavljen da postane dostupan ChatGPT Plus i Enterprise kupci početkom listopada. Međutim, specifičnosti u pogledu dodjele kredita za ChatGPT Osim toga, korisnici i povezani troškovi ostaju nejasni. Pristup će biti omogućen putem API-ja i OpenAI Platforma Labs "kasnije u jesen."
Uspješnost integracije: DALL-E je postavljen za besprijekornu integraciju u partnerske i Microsoftove proizvode. Očekujte da ćete svjedočiti stvaranju prezentacija, ilustracija, dizajna, logotipa, sve u kontekstu i pojačano uz pomoć ChatGPT. Ova će integracija postati mainstream, predstavljajući značajan izazov za konkurente poput Google sa svojim Bardom i ideogram.
Konvergencija LLM-a i vizualnog sadržaja: Najintrigantniji aspekt leži u konvergenciji velikih jezičnih modela (LLM) i modela generiranja vizualnog sadržaja. Označava pomak od složenog brzog inženjeringa do izražavanja ideja pristupačnijim jezikom. AI će prikupiti kontekst i ideje iz tih izraza, nudeći kreativne mogućnosti kojima je teško odoljeti.
DALL-E 3: Budite novi lider u generaciji AI slike
OpenAIodluku da integrira DALL-E 3 u ChatGPT ekosustav je strateški potez. Ova integracija omogućuje DALL-E 3 pristup velikoj korisničkoj bazi podataka od 100 milijuna aktivnih korisnika. Ovaj korak značajno povećava dostupnost DALL-E 3 i ima potencijal katapultirati njegovu popularnost.
Trenutno, Midjourney i Stable Diffusion hvaliti se okolo 15 milijuna registriranih korisnika. Međutim, s ovom integracijom, DALL-E 3 bi trebao dobiti pristup bazi korisnika deset puta većoj - 100 milijuna korisnika. Ovo čini ChatGPT Plus pretplata plan još privlačniji jer nudi pristup chatbotu, analitičkim alatima i generiranju slika, a sve po pristupačnoj cijeni.
Integracija nije samo korisna za postojeće korisnike, već služi i kao snažan magnet za nove korisnike. Proširuje OpenAI doseg i popularnost ekosustava, privlačeći pojedince koji traže rješenja sadržaja generirana umjetnom inteligencijom.
Ovaj strateški potez je spreman za jačanje OpenAIprihod i druge ključne metrike. Investitori tvrtke vjerojatno će pozitivno gledati na ovaj razvoj događaja, posebno u svjetlu nedavnih 20% pad obima prometa tijekom ljeta.
Pročitajte još povezanih tema:
Izjava o odricanju od odgovornosti
U skladu s Smjernice projekta povjerenja, imajte na umu da informacije navedene na ovoj stranici nemaju namjeru i ne smiju se tumačiti kao pravni, porezni, investicijski, financijski ili bilo koji drugi oblik savjeta. Važno je ulagati samo ono što si možete priuštiti izgubiti i potražiti neovisni financijski savjet ako imate bilo kakvih nedoumica. Za dodatne informacije predlažemo da pogledate odredbe i uvjete, kao i stranice za pomoć i podršku koje pruža izdavatelj ili oglašivač. MetaversePost je predan točnom, nepristranom izvješćivanju, ali tržišni uvjeti podložni su promjenama bez prethodne najave.
O autoru
Damir je voditelj tima, product manager i urednik u Metaverse Post, koji pokriva teme kao što su AI/ML, AGI, LLMs, Metaverse i Web3- srodna polja. Njegovi članci privlače ogromnu publiku od preko milijun korisnika svakog mjeseca. Čini se da je stručnjak s 10 godina iskustva u SEO-u i digitalnom marketingu. Damir je spomenut u Mashableu, Wiredu, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i druge publikacije. Putuje između UAE, Turske, Rusije i CIS-a kao digitalni nomad. Damir je stekao diplomu prvostupnika fizike, za koju vjeruje da mu je dala vještine kritičkog razmišljanja potrebne za uspjeh u stalno promjenjivom okruženju interneta.
Više članakaDamir je voditelj tima, product manager i urednik u Metaverse Post, koji pokriva teme kao što su AI/ML, AGI, LLMs, Metaverse i Web3- srodna polja. Njegovi članci privlače ogromnu publiku od preko milijun korisnika svakog mjeseca. Čini se da je stručnjak s 10 godina iskustva u SEO-u i digitalnom marketingu. Damir je spomenut u Mashableu, Wiredu, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i druge publikacije. Putuje između UAE, Turske, Rusije i CIS-a kao digitalni nomad. Damir je stekao diplomu prvostupnika fizike, za koju vjeruje da mu je dala vještine kritičkog razmišljanja potrebne za uspjeh u stalno promjenjivom okruženju interneta.