DALL-E 3 relizni kuchaytiradi OpenAIning ta'siri, ketish Midjourney va Stable Diffusion Orqasida
Qisqacha
DALL-E 3 bilan muammosiz integratsiya qilingan GPT-4, uchun maxsus tayyorlangan ChatGPT+ obunachilar.
DALL-E 3 jamoat arboblarining ismlari aniq tilga olinganda ularning suratlarini qayta yaratishdan saqlaydi.
DALL-E 3 ga kirish uchun vaqt jadvali oktyabr oyi uchun belgilangan.
OpenAI o'zining so'nggi ijodini taqdim etdi: DALL-E3. O'zidan oldingilaridan farqli o'laroq, DALL-E 3 asosiy e'tiborni mayda-chuydalarni aniqlashtirish, harflar va barmoqlar kabi murakkab tana detallari kabi muammolarni hal qilishga qaratilgan. Natija? Murakkab maslahatlar yoki vaqtinchalik echimlarni talab qilmasdan, estetik jihatdan yoqimli tasvirlar to'plami.
Shuni ta'kidlash kerakki, ushbu nashr keng qamrovli amalga oshirish tafsilotlari, maqolalar yoki API-lar bilan ta'minlanmagan. Buning o'rniga, DALL-E 3 muammosiz integratsiyalangan bo'lishi kerak GPT-4, uchun maxsus tayyorlangan ChatGPT+ obunachilar.
Ushbu rivojlanish AI landshaftidagi seysmik siljish emas, balki modellar o'rtasidagi hamkorlikda oldinga qadam bo'lishi mumkin. Ko'pchilik keyingisini kutmoqda Stable Diffusion model yanada nafosat va badiiy joziba taqdim etadi.
Buni kontekstga solish uchun, OpenAIAI tasvirini yaratish bo'yicha sayohati juda mashaqqatli bo'ldi:
- 2021: DALL-E 1, 12 milliard parametrli model cheklangan ma'lumot bilan taqdim etildi.
- 2021: 2 milliard parametrli GLIDE modeli ochiq manbali 300 million parametrli modellar bilan birga taqdim etildi.
- 2022: DALL-E 2 2 milliard parametrga ega, unCLIP qog'ozi va API bilan birga keldi.
- 2023: DALL-E 3 o'zining kirish joyini yaratdi va tafsilotlar biroz sirli bo'lishi mumkin bo'lsa-da, bir narsa aniq - u bilan birlashadi GPT-4 uchun ChatGPT+ obunachilar.
Hozircha DALL-E 3 ning vizuallari biroz kamligicha qolmoqda. Hech qanday kod bazasi, blog posti yoki zamonaviy (SOTA) bilan batafsil taqqoslash mavjud emas. OpenAI kartalarini ko'kragiga yaqin tutayotganga o'xshaydi.
Model o'zidan oldingilariga qaraganda nuanslar va tafsilotlarni chuqurroq tushunishga ega ekanligi ta'kidlanadi. Bu sizning ijodiy kontseptsiyalaringizni juda aniq tasvirlarga tarjima qilish jarayoni yanada yumshoqroq bo'lishini anglatadi.
DALL-E 3 ning qiziqarli va'dalaridan biri uning integratsiyalashuvidir ChatGPT. Bu shuni anglatadiki, foydalanuvchilar murakkab ko'rsatmalarni yaratish bilan kurashishlari shart emas; bilan qisqacha tavsif yetarli bo'lishi kerak ChatGPT sizning nomingizdan mohirlik bilan batafsil ko'rsatmalar yaratish.
OpenAI Shuningdek, uzun so'rovlarda kontekstning muhimligini ta'kidladi. DALL-E 3 keng qamrovli ko'rsatmalarda tasvirlangan kontekstga ko'proq moslashtirish uchun mo'ljallangan.
Shunga qaramay, har qanday yangi AI modelida bo'lgani kabi, noma'lum element ham mavjud. Dastlabki ko'rinishlar istiqbolli ko'rinsa-da, haqiqiy lakmus testi uzoq muddat foydalanish bilan birga keladi. Uning samaradorligi va ishlash tezligi haqida savollar tug'iladi.
DALL-E 3 ko'p bosqichli diffuziya jarayoni bo'lishi mumkin GPT-4 matn kodlovchisi sifatida xizmat qiladi. Ushbu o'rnatishning murakkab mexanikasi maxfiyligicha qolishi mumkin.
DALL-E 3 ga kirish uchun vaqt jadvali dastlab oktyabr oyida belgilangan ChatGPT Plus va ChatGPT Korxona foydalanuvchisis, keyinchalik tadqiqotchilar uchun kengroq kirish imkoniyati bilan.
Nayranglar va tsenzura DALL-E 3
DALL-E 3 ning rivojlanishining asosiy nuqtalari uning imkoniyatlarini cheklashning puxta jarayoni edi. Bu muayyan turdagi kontentni istisno qilish uchun mo'ljallangan qattiq hizalama va filtrlarni o'z ichiga oldi. Misol uchun, model taniqli shaxslarning suratlarini yaratishni, taniqli rassomlar uslubidagi san'at asarlarini takrorlashni yoki xavfli deb hisoblangan har qanday kontentni yaratishni qat'iyan rad etadi. OpenAIning aniq standartlari. Ushbu strategik yondashuv faqat cheklovlar bilan bog'liq emas; bu kompaniyani mumkin bo'lgan huquqiy chalkashliklardan himoya qilishga qaratilgan faol choradir.
Biroq, bu filtrlar va hizalamalardan tashqari, ba'zi qiziqarli kuzatishlar paydo bo'ladi. Fotorealistik tarkibni yaratishda DALL-E 3 ma'lum bir zaiflikni namoyon qiladi. Haqiqiy fotosuratlarni mukammal taqlid qiladigan tasvirlar ishlab chiqarish o'rniga, chiqish aniq stilize qilingan sifatga ega. AI tomonidan yaratilgan ushbu suratlar deyarli renderlangan va biroz plastik ko'rinishga ega. Hatto "fotosurat" so'zi bilan aniq so'ralganda ham, natija o'ziga xos stilizatsiyada mustahkamlanib qoladi.
Shuni ta'kidlash kerakki, ushbu o'ziga xosliklarga qaramay, DALL-E 3 ajoyib potentsialni taqdim etadi. Uning ijodlari orasida ba'zi misollar fotosuratlarga ajoyib o'xshashlikni namoyish etadi. Shuni yodda tutish kerakki, ushbu tasvirlarning simulyatsiya qilingan realizmi, ayniqsa, suv ostida bo'lsa, xuddi shu mavzudagi haqiqiy fotosurat qanday paydo bo'lishiga mos kelmaydi.
tegishli: Microsoft DALL-E 2 asosidagi birinchi professional Text-to-Image vositasi - Designerni taqdim etdi. |
DALL-E 3 xususiyatlari va tafsilotlari
Keling, ushbu yangi model haqiqatan ham nimani taklif qilishini tushunish uchun piksellarni elakdan o'tkazamiz va qatorlarni o'qib chiqamiz.
Stilizatsiya san'ati: Ko'zdan kechirish OpenAIning Instagram hisobi, siz ajoyib stilizatsiya bilan ajralib turadigan ko'plab san'at asarlarini ko'rasiz. Mavhum kompozitsiyalar va dizaynlarning ta'sirchan to'plami mavjud bo'lsa-da, model fotorealistik tarkibni ishlab chiqarishdan yiroqdek tuyuladi. Bu erda asosiy e'tibor haqiqatga taqlid qilish emas, balki estetika va ijodkorlikka qaratilgan.
Badiiy cheklovlar: DALL-E 3 avvalgisidan boshqacha yo'l tutadi. U tirik rassomlar uslubida tasvirlarni yaratishni qat'iyan rad etadi, bu DALL-E 2 dan keskin farq qiladi, bu ba'zi rassomlarning uslublariga taqlid qilishi mumkin. Bu esa ijodiy hamjamiyatning iliq qabuliga o'xshab, qoshlarni ko'tarishi mumkin Stable Diffusion 2.0.
Rassomlarni kuchaytirish: Rassomlar huquqlarini hurmat qilish harakatida, OpenAI rassomlarga o'z ishlarini kelajakdagi DALL-E versiyalaridan chiqarib tashlashga imkon beradi. Rassomlar o'zlarining huquqlariga ega bo'lgan rasmni yuborish orqali uni model chiqishidan chiqarib tashlashni talab qilishlari mumkin. Kelajakda DALL-E iteratsiyalari shunga o'xshash tarkibni yaratishdan qochadi rassom uslubi.
Xavfsizlik va tsenzura: OpenAIning xavfsizlik haqidagi paranoyasi seziladi. Ular tashqi “qizil jamoalar” bilan hamkorlik qilib, model xavfsizligini sinab ko‘rishdi va modelni aniq yoki zararli kontentga olib kelishi mumkin bo‘lgan aniq so‘zlarga e’tibor bermaslikka o‘rgatish uchun kirish tasniflagichlaridan foydalanishdi. DALL-E 3 tasvirlarni qayta yaratishdan saqlaydi jamoat arboblari ularning ismlari aniq tilga olinganda. Mashhurlar ushbu toifaga kiradimi yoki yo'qmi, noma'lum bo'lib qolmoqda, bu esa yaratilgan yuzlarning sifatiga ta'sir qilishi mumkin.
Suv belgilari va kuzatish: “AI tomonidan yaratilgan tasvirlar”ni kuzatish uchun teglarni oʻrnatishga ishora bor, bu yaratilgan kontentni yaxshiroq kuzatish va suv belgilarini qoʻyish yoʻlidagi harakatni koʻrsatadi.
Matn va qo'llar yaxshilandi: OpenAI touts takomillashtirilgan matn yaratish va qo'lda renderlash, raqobatchilar orasida keng tarqalgan da'vo. Haqiqiy sinov gilos tanlab olingan misollardan tashqari haqiqiy chiqishda yotadi.
Fazoviy tushuncha: DALL-E 3 ko'rsatmalarda tasvirlangan fazoviy munosabatlarni tushunishda ustundir. Bu modelning murakkab burchaklar va kompozitsiyalarni yaratish qobiliyatini oshiradi, ammo foydalanuvchilar bu va'daning aniqroq dalillarini kutishmoqda.
Takliflarning kuchi: Asosiysi DALL-E3 bilan tezkor imkoniyatlari va integratsiyalashuvida yotadi ChatGPT. Bu tezkor dizaynni avtomatlashtirish, tezlik va soddalashtirishni va'da qiladi. Bu erdagi tendentsiya chatGPT ko'rsatmalar yaratish, noaniq g'oyalar yoki ibtidoiy takliflarni notiqlarga tarjima qilish. DALL-E 3 ning takomillashtirilgan kontekstli tushunchasi jarayonni soddalashtiradi va foydalanuvchilarga aniqlikdan ko'ra niyatga e'tibor qaratish imkonini beradi.
Kechirilmagan hududlar: Bo'yash, bo'yash, generativ to'ldirish va 3D modellashtirish kabi jihatlar muhokamada yo'q. Ushbu xususiyatlarning yo'qligi, ayniqsa, ko'p qirrali modellarga o'rganib qolgan foydalanuvchilar uchun cheklov bo'lishi mumkin.
Tafsilotlarga kirish: DALL-E 3 foydalanish mumkin bo'ladi ChatGPT Oktyabr boshida Plus va Enterprise mijozlari. Biroq, kreditlarni taqsimlash bilan bog'liq o'ziga xosliklar ChatGPT Bundan tashqari, foydalanuvchilar va tegishli xarajatlar noaniqligicha qolmoqda. Kirish API va orqali taqdim etiladi OpenAI Laboratoriya platformasi "keyinroq kuzda".
Integratsiya qobiliyati: DALL-E hamkor va Microsoft mahsulotlariga muammosiz integratsiyalangan bo'lishi kerak. Taqdimotlar, illyustratsiyalar, dizaynlar, logotiplarning barchasi kontekstda va yordami bilan kuchaytirilishiga guvoh bo'lishni kuting. ChatGPT. Ushbu integratsiya asosiy oqimga aylanadi va bu kabi raqobatchilarga jiddiy muammo tug'diradi Bard bilan Google va Ideogramma.
LLM va vizual tarkibning yaqinlashishi: Eng qiziqarli jihati katta til modellari (LLM) va vizual kontent yaratish modellarining birlashuvidadir. Bu murakkab tezkor muhandislikdan g'oyalarni yanada qulayroq tilda ifodalashga o'tishni anglatadi. AI ushbu iboralardan kontekst va g'oyalarni to'playdi va qarshilik ko'rsatish qiyin bo'lgan ijodiy imkoniyatlarni taklif qiladi.
tegishli: AI Art Generatorlari uchun 50 ta eng yaxshi matndan tasvirga maslahatlar Midjourney va DALL-E |
DALL-E 3: AI tasvirini yaratishda yangi yetakchi bo‘ling
OpenAIning DALL-E 3 ni integratsiyalashuvi haqidagi qarori ChatGPT ekotizim strategik harakatdir. Ushbu integratsiya DALL-E 3-ga 100 million faol foydalanuvchilarning keng ma'lumotlar bazasiga kirish imkonini beradi. Bu qadam DALL-E 3 ning foydalanish imkoniyatini sezilarli darajada oshiradi va uning mashhurligini oshirish potentsialiga ega.
Bugungi kunda, Midjourney va Stable Diffusion atrofida maqtanish 15 million ro'yxatdan o'tgan foydalanuvchilar. Biroq, ushbu integratsiya bilan DALL-E 3 foydalanuvchi bazasidan o'n baravar ko'p - 100 million foydalanuvchiga kirish huquqiga ega. Bu qiladi ChatGPT Plus obuna Rejani yanada jozibador qiling, chunki u chatbotga, tahliliy vositalarga va tasvirlarni yaratishga kirishni taklif qiladi, hammasi hamyonbop narxda.
Integratsiya nafaqat mavjud foydalanuvchilar uchun foydali, balki yangi foydalanuvchilar uchun kuchli magnit bo'lib xizmat qiladi. ni kengaytiradi OpenAI ekotizimning keng qamrovi va ommabopligi, AI tomonidan yaratilgan kontent yechimlarini izlayotgan shaxslarni jalb qilish.
Ushbu strategik harakat kuchayishi kutilmoqda OpenAIning daromadi va boshqa asosiy ko'rsatkichlar. Kompaniyaning sarmoyadorlari, ayniqsa, yaqinda sodir bo'lgan voqealarni hisobga olgan holda, ushbu rivojlanishni ijobiy baholaydilar Trafik hajmining 20% ga qisqarishi yoz davomida.
Ko'proq tegishli mavzularni o'qing:
Masʼuliyatdan voz kechish
Bunga javoban Ishonch loyihasi bo'yicha ko'rsatmalar, iltimos, ushbu sahifada taqdim etilgan ma'lumotlar yuridik, soliq, investitsiya, moliyaviy yoki boshqa har qanday maslahat shakli sifatida talqin qilinmasligi va talqin qilinmasligini unutmang. Faqat yo'qotishingiz mumkin bo'lgan narsaga investitsiya qilish va agar shubhangiz bo'lsa, mustaqil moliyaviy maslahat olish muhimdir. Qo'shimcha ma'lumot olish uchun biz shartlar va emitent yoki reklama beruvchi tomonidan taqdim etilgan yordam va qo'llab-quvvatlash sahifalariga murojaat qilishni tavsiya qilamiz. MetaversePost to'g'ri, xolis hisobot berish majburiyatini oladi, lekin bozor sharoitlari ogohlantirilmasdan o'zgarishi mumkin.
Muallif haqida
Damir - guruh rahbari, mahsulot menejeri va muharrir Metaverse Post, AI/ML, AGI, LLMs, Metaverse va kabi mavzularni qamrab oladi Web3- tegishli sohalar. Uning maqolalari har oy milliondan ortiq foydalanuvchilarning katta auditoriyasini jalb qiladi. U SEO va raqamli marketing bo'yicha 10 yillik tajribaga ega mutaxassis bo'lib ko'rinadi. Damir haqida Mashable, Wired nashrlarida tilga olingan. Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto va boshqa nashrlar. U BAA, Turkiya, Rossiya va MDH davlatlari oʻrtasida raqamli koʻchmanchi sifatida sayohat qiladi. Damir fizika bo'yicha bakalavr darajasini oldi, uning fikricha, bu unga internetning doimiy o'zgaruvchan manzarasida muvaffaqiyatga erishish uchun zarur bo'lgan tanqidiy fikrlash qobiliyatlarini berdi.
Boshqa maqolalarDamir - guruh rahbari, mahsulot menejeri va muharrir Metaverse Post, AI/ML, AGI, LLMs, Metaverse va kabi mavzularni qamrab oladi Web3- tegishli sohalar. Uning maqolalari har oy milliondan ortiq foydalanuvchilarning katta auditoriyasini jalb qiladi. U SEO va raqamli marketing bo'yicha 10 yillik tajribaga ega mutaxassis bo'lib ko'rinadi. Damir haqida Mashable, Wired nashrlarida tilga olingan. Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto va boshqa nashrlar. U BAA, Turkiya, Rossiya va MDH davlatlari oʻrtasida raqamli koʻchmanchi sifatida sayohat qiladi. Damir fizika bo'yicha bakalavr darajasini oldi, uning fikricha, bu unga internetning doimiy o'zgaruvchan manzarasida muvaffaqiyatga erishish uchun zarur bo'lgan tanqidiy fikrlash qobiliyatlarini berdi.