DALL-E 3 izlaidums pastiprina OpenAIIetekme, aiziešana Midjourney un Stable Diffusion aiz
Īsumā
DALL-E 3 ir iestatīts tā, lai tas būtu nemanāmi integrēts ar GPT-4, kas īpaši pielāgots ChatGPT+ abonenti.
DALL-E 3 atturas no publisku personu attēlu atjaunošanas, ja viņu vārdi ir skaidri minēti.
Laika grafiks piekļuvei DALL-E 3 ir noteikts oktobrī.
OpenAI ir atklājis savu jaunāko radīšanu: DALL-E3. Atšķirībā no saviem priekšgājējiem, DALL-E 3 koncentrējas uz detaļu uzlabošanu, risinot tādas problēmas kā burti un sarežģītas ķermeņa detaļas, piemēram, pirksti. Rezultāts? Estētiski pievilcīgu attēlu klāsts bez sarežģītiem norādījumiem vai risinājumiem.
Ir svarīgi ņemt vērā, ka šajā laidienā nav iekļauta visaptveroša ieviešanas informācija, raksti vai API. Tā vietā DALL-E 3 ir iestatīts tā, lai tas būtu nemanāmi integrēts ar GPT-4, kas īpaši pielāgots ChatGPT+ abonenti.
Šī attīstība var nebūt seismiska AI ainavas maiņa, bet gan solis uz priekšu modeļu sadarbībā. Daudzi paredz, ka nākamais Stable Diffusion modelis piedāvās vēl lielāku izsmalcinātību un māksliniecisku pievilcību.
Lai to ievietotu kontekstā, OpenAICeļojums caur AI attēlu ģenerēšanu ir bijis diezgan garš:
- 2021: DALL-E 1, 12 miljardu parametru modelis, tika ieviests ar ierobežotu informāciju.
- 2021: GLIDE, 2 miljardu parametru modelis, tika atklāts kopā ar atvērtā koda 300 miljonu parametru modeļiem.
- 2022: Ienāca DALL-E 2 ar 2 miljardiem parametru, un kopā ar unCLIP papīru un API.
- 2023: DALL-E 3 ir ienācis tirgū, un, lai gan detaļas varētu būt nedaudz noslēpumainas, viens ir skaidrs — tas integrēsies ar GPT-4 forums ChatGPT+ abonenti.
Pašlaik DALL-E 3 vizuālie materiāli joprojām ir nedaudz ierobežoti. Nav koda bāzes, emuāra ziņas vai detalizēta salīdzinājuma ar jaunākajām tehnoloģijām (SOTA). OpenAI šķiet, ka tur savas kārtis pie krūtīm.
Modelis tiek reklamēts, lai iegūtu dziļāku izpratni par niansēm un detaļām, salīdzinot ar tā priekšgājējiem. Tas nozīmē, ka jūsu radošo koncepciju pārveidošana ļoti precīzos attēlos būs vienmērīgāks process.
Viens intriģējošs DALL-E 3 solījums ir tā integrācija ar ChatGPT. Tas nozīmē, ka lietotājiem nebūs jācīnās ar sarežģītu uzvedņu veidošanu; ar īsu aprakstu vajadzētu pietikt ChatGPT lietpratīgi ģenerējot detalizētas uzvednes jūsu vārdā.
OpenAI ir arī uzsvēris konteksta nozīmi garās uzvednēs. DALL-E 3 ir izstrādāts, lai ietvertu daudzvārdību, padarot to labāku pieskaņotu kontekstam, kas aprakstīts plašās uzvednēs.
Tomēr, tāpat kā jebkurā jaunā AI modelī, ir nezināmā elements. Lai gan sākotnējie ieskati izskatās daudzsološi, īsts lakmusa papīrs nāks ar ilgstošu lietošanu. Jautājumi kavējas par tā efektivitāti un darbības ātrumu.
Visticamāk, ka DALL-E 3 būs daudzpakāpju difūzijas process, ar GPT-4 kalpo kā teksta kodētājs. Šīs iestatīšanas sarežģītā mehānika var palikt noslēpumā.
Laika grafiks piekļuvei DALL-E 3 ir noteikts oktobrī, sākotnēji uz ChatGPT Plus un ChatGPT Uzņēmuma lietotājss, ar iespēju pētniekiem pēc tam nodrošināt plašāku piekļuvi.
Nianses un cenzūra no DALL-E 3
Galvenais DALL-E 3 izstrādes fokuss bija rūpīgs process, lai ierobežotu tā iespējas. Tas ietvēra stingru izlīdzināšanu un filtrus, kas izstrādāti, lai izslēgtu noteikta veida saturu. Piemēram, modele stingri atsakās ģenerēt slavenu personību attēlus, replicēt mākslas darbus slavenu mākslinieku stilā vai veidot jebkādu saturu, ko uzskata par nedrošu. OpenAI's zinoši standarti. Šī stratēģiskā pieeja nav saistīta tikai ar ierobežojumiem; tas ir proaktīvs pasākums, kura mērķis ir pasargāt uzņēmumu no iespējamiem juridiskiem sajaukumiem.
Tomēr ārpus šiem filtriem un izlīdzinājumiem atklājas daži intriģējoši novērojumi. Šķiet, ka DALL-E 3 ir zināms vājums, kad runa ir par fotoreālistiska satura radīšanu. Tā vietā, lai radītu attēlus, kas nevainojami atdarina reālas fotogrāfijas, izvadei ir izteikta stilizēta kvalitāte. Šie mākslīgā intelekta radītie attēli izstaro gandrīz atveidotu un nedaudz plastisku izskatu. Pat tad, ja tiek skaidri norādīts ar vārdu “fotografēt”, rezultāts paliek iesakņojies tai raksturīgajā stilizācijā.
Ir vērts atzīmēt, ka, neskatoties uz šīm īpatnībām, DALL-E 3 piedāvā ievērojamu potenciālu. Starp tās darbiem dažiem gadījumiem ir pārsteidzoša līdzība ar fotogrāfijām. Jāpatur prātā, ka šo attēlu simulētais reālisms ne vienmēr atbilst tam, kā izskatītos īsta fotogrāfija ar vienu un to pašu objektu, it īpaši, ja tas ir iegremdēts zem ūdens.
saistīts: Microsoft atklāja Designer, pirmo profesionālo teksta pārveides rīku, kura pamatā ir DALL-E 2 |
DALL-E 3 funkcijas un informācija
Veltisim brīdi, lai izsijātu pikseļus un lasītu starp rindām, lai saprastu, ko šis jaunais modelis patiesi piedāvā.
Stilizācijas māksla: Paskatoties cauri OpenAIInstagram kontā, pamanīsit mākslas darbu pārpilnību, ko raksturo izsmalcināta stilizācija. Lai gan ir iespaidīgs abstraktu kompozīciju un dizainu klāsts, šķiet, ka modelis izvairās no fotoreālistiska satura radīšanas. Šeit uzsvars tiek likts uz estētiku un radošumu, nevis realitātes atdarināšanu.
Mākslinieciskie ierobežojumi: DALL-E 3 izmanto citu ceļu nekā tā priekšgājējs. Tā kategoriski atsakās radīt attēlus dzīvo mākslinieku stilā, krasi atkāpjoties no DALL-E 2, kas varētu atdarināt noteiktu mākslinieku stilus. Tas radošajā sabiedrībā var saraut uzacis, līdzīgi kā remdenā uzņemšana Stable Diffusion 2.0.
Mākslinieku pilnvarošana: lai ievērotu mākslinieku tiesības, OpenAI ļauj māksliniekiem izslēgt savus darbus no turpmākajām DALL-E versijām. Iesniedzot attēlu, uz kuru viņiem pieder tiesības, mākslinieki var pieprasīt tā izslēgšanu no modeļa produkcijas. Turpmākās DALL-E iterācijas ļaus izvairīties no satura ģenerēšanas, kas līdzinās šim mākslinieka stils.
Drošība un cenzūra: OpenAIir jūtama paranoja par drošību. Viņi ir sadarbojušies ar ārējām “sarkanajām komandām”, lai pārbaudītu modeļa drošību, un izmantojuši ievades klasifikatorus, lai mācītu modelim ignorēt konkrētus vārdus, kas var novest pie nepārprotama vai kaitīga satura. DALL-E 3 atturas no attēlu atjaunošanas sabiedriskās personas kad viņu vārdi ir skaidri minēti. Joprojām nav skaidrs, vai slavenības ietilpst šajā kategorijā, un tas var ietekmēt ģenerēto seju kvalitāti.
Ūdenszīmes un izsekošana: ir mājiens uz tagu iegulšanu, lai izsekotu “AI ģenerētus attēlus”, norādot uz virzību uz labāku uzraudzību un, iespējams, ģenerētā satura ūdenszīmēm.
Teksts un rokas ir uzlabotas: OpenAI piedāvā uzlabotu teksta ģenerēšanu un roku atveidošanu, kas ir izplatīts konkurentu apgalvojums. Īstais pārbaudījums slēpjas faktiskajā izlaidē, nevis tikai atlasītajos piemēros.
Telpiskā izpratne: DALL-E 3 lieliski izprot uzvednēs aprakstītās telpiskās attiecības. Tas uzlabo modeļa spēju konstruēt sarežģītus leņķus un kompozīcijas, lai gan lietotāji gaida konkrētākus pierādījumus par šo solījumu.
Pamudinājumu spēks: būtība DALL-E3 slēpjas tā ātrajās iespējās un integrācijā ar ChatGPT. Tas sola automatizāciju, ātrumu un tūlītēja dizaina vienkāršošanu. Tendence šeit ir uz chatGPT uzvedņu ģenerēšana, pārvēršot neskaidras idejas vai rudimentārus pamudinājumus daiļrunīgās. DALL-E 3 uzlabotā kontekstuālā izpratne racionalizē procesu, ļaujot lietotājiem koncentrēties uz nodomu, nevis runīgumu.
Neapzīmētas teritorijas: Diskusijā īpaši nav iekļauti tādi aspekti kā krāsošana, pārkrāsošana, ģeneratīvā aizpildīšana un 3D modelēšana. Šo funkciju trūkums varētu būt ierobežojums, jo īpaši lietotājiem, kas pieraduši pie daudzpusīgākiem modeļiem.
Piekļuves informācija: DALL-E 3 ir iestatīts, lai kļūtu pieejams ChatGPT Plus un Enterprise klientiem oktobra sākumā. Taču specifika attiecībā uz kredītu piešķiršanu par ChatGPT Plus lietotāji un saistītās izmaksas joprojām nav skaidras. Piekļuve tiks nodrošināta, izmantojot API un OpenAI Labs platforma “vēlāk rudenī”.
Integrācijas spējas: DALL-E ir paredzēts nemanāmi integrētai partneru un Microsoft produktos. Gaidiet prezentāciju, ilustrāciju, dizainu, logotipu ģenerēšanu kontekstā un pastiprinās ar palīdzību no ChatGPT. Šai integrācijai ir jākļūst par galveno, radot ievērojamu izaicinājumu tādiem konkurentiem kā Google ar savu bardu un ideogramma.
LLM un vizuālā satura konverģence: Intriģējošākais aspekts ir lielo valodu modeļu (LLM) un vizuālā satura ģenerēšanas modeļu konverģence. Tas nozīmē pāreju no sarežģītas tūlītējas inženierijas uz ideju izteikšanu pieejamākā valodā. AI no šīm izpausmēm gūs kontekstu un idejas, piedāvājot radošas iespējas, kurām ir grūti pretoties.
DALL-E 3: esiet jauns AI attēlu ģenerēšanas līderis
OpenAIlēmumu integrēt DALL-E 3 ChatGPT ekosistēma ir stratēģisks solis. Šī integrācija nodrošina DALL-E 3 piekļuvi plašai lietotāju datubāzei ar 100 miljoniem aktīvo lietotāju. Šis solis ievērojami uzlabo DALL-E 3 pieejamību un var katapultēt tā popularitāti.
Pašlaik, Midjourney un Stable Diffusion lielīties apkārt 15 miljoni reģistrēto lietotāju. Tomēr ar šo integrāciju DALL-E 3 ir iestatīts, lai iegūtu piekļuvi desmit reizes lielākai lietotāju bāzei — 100 miljoniem lietotāju. Tas padara ChatGPT Plus abonements plāns ir vēl pievilcīgāks, jo tas piedāvā piekļuvi tērzēšanas robotam, analītiskajiem rīkiem un attēlu ģenerēšanai par pieņemamu cenu.
Integrācija ir ne tikai izdevīga esošajiem lietotājiem, bet arī kalpo kā spēcīgs magnēts jauniem lietotājiem. Tas paplašina OpenAI ekosistēmas sasniedzamību un popularitāti, piesaistot cilvēkus, kuri meklē AI radīta satura risinājumus.
Šis stratēģiskais solis ir gatavs palielināties OpenAIieņēmumus un citus galvenos rādītājus. Uzņēmuma investori, visticamāk, šo attīstību vērtēs labvēlīgi, īpaši ņemot vērā neseno 20% satiksmes apjoma samazināšanās vasaras laikā.
Lasiet vairāk saistītās tēmas:
Atbildības noraidīšana
Atbilstīgi Uzticības projekta vadlīnijas, lūdzu, ņemiet vērā, ka šajā lapā sniegtā informācija nav paredzēta un to nedrīkst interpretēt kā juridisku, nodokļu, ieguldījumu, finanšu vai jebkāda cita veida padomu. Ir svarīgi ieguldīt tikai to, ko varat atļauties zaudēt, un meklēt neatkarīgu finanšu padomu, ja jums ir šaubas. Lai iegūtu papildinformāciju, iesakām skatīt pakalpojumu sniegšanas noteikumus, kā arī palīdzības un atbalsta lapas, ko nodrošina izdevējs vai reklāmdevējs. MetaversePost ir apņēmies sniegt precīzus, objektīvus pārskatus, taču tirgus apstākļi var tikt mainīti bez iepriekšēja brīdinājuma.
Par Autors
Damirs ir komandas vadītājs, produktu vadītājs un redaktors Metaverse Post, kas aptver tādas tēmas kā AI/ML, AGI, LLM, Metaverse un Web3- saistītie lauki. Viņa raksti katru mēnesi piesaista lielu auditoriju, kas pārsniedz miljonu lietotāju. Šķiet, ka viņš ir eksperts ar 10 gadu pieredzi SEO un digitālā mārketinga jomā. Damirs ir minēts Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto un citas publikācijas. Viņš ceļo starp AAE, Turciju, Krieviju un NVS kā digitālais nomads. Damirs ir ieguvis bakalaura grādu fizikā, kas, viņaprāt, ir devis viņam kritiskās domāšanas prasmes, kas nepieciešamas, lai gūtu panākumus nepārtraukti mainīgajā interneta vidē.
Vairāk rakstusDamirs ir komandas vadītājs, produktu vadītājs un redaktors Metaverse Post, kas aptver tādas tēmas kā AI/ML, AGI, LLM, Metaverse un Web3- saistītie lauki. Viņa raksti katru mēnesi piesaista lielu auditoriju, kas pārsniedz miljonu lietotāju. Šķiet, ka viņš ir eksperts ar 10 gadu pieredzi SEO un digitālā mārketinga jomā. Damirs ir minēts Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto un citas publikācijas. Viņš ceļo starp AAE, Turciju, Krieviju un NVS kā digitālais nomads. Damirs ir ieguvis bakalaura grādu fizikā, kas, viņaprāt, ir devis viņam kritiskās domāšanas prasmes, kas nepieciešamas, lai gūtu panākumus nepārtraukti mainīgajā interneta vidē.