DALL-E 3 Buraxılış Gücləndirir OpenAI'nin Təsiri, Ayrılması Midjourney və Stable Diffusion Arxada
Qısaca
DALL-E 3 problemsiz şəkildə inteqrasiya olunacaq GPT-4üçün xüsusi olaraq hazırlanmışdır ChatGPT+ abunəçilər.
DALL-E 3 ictimai xadimlərin adları açıq şəkildə qeyd olunduqda onların şəkillərini yenidən yaratmaqdan çəkinir.
DALL-E 3-ə giriş üçün vaxt qrafiki oktyabr ayına təyin edilib.
OpenAI ən son yaradıcılığını təqdim etdi: DALL-E3. Sələflərindən fərqli olaraq, DALL-E 3 incəlikləri dəqiqləşdirməyə, hərf və barmaqlar kimi mürəkkəb bədən detallarına diqqət yetirir. Nəticə? Mürəkkəb göstərişlərə və ya həll yollarına ehtiyac olmadan estetik baxımdan xoşagələn şəkillər toplusu.
Qeyd etmək vacibdir ki, bu buraxılış hərtərəfli həyata keçirmə təfərrüatları, məqalələr və ya API-lər dəsti ilə gəlmir. Əvəzində, DALL-E 3 problemsiz şəkildə inteqrasiya olunacaq GPT-4üçün xüsusi olaraq hazırlanmışdır ChatGPT+ abunəçilər.
Bu inkişaf süni intellekt mənzərəsində seysmik dəyişiklik deyil, modellər arasında əməkdaşlıqda irəliyə doğru bir addım ola bilər. Çoxları bundan sonrakını gözləyir Stable Diffusion model daha böyük incəlik və bədii cazibə təqdim edəcək.
Kontekstdə ifadə etsək, OpenAIsüni intellekt imicinin yaradılması üzrə səyahəti olduqca çətin olub:
- 2021: 1 milyard parametr modeli olan DALL-E 12 məhdud məlumatlarla təqdim edildi.
- 2021: 2 milyard parametr modeli olan GLIDE, açıq mənbəli 300 milyon parametrli modellərlə birlikdə təqdim edildi.
- 2022: DALL-E 2, unCLIP kağızı və API ilə müşayiət olunan 2 milyard parametrə sahib çıxdı.
- 2023: DALL-E 3 öz girişini etdi və təfərrüatlar bir qədər sirli olsa da, bir şey aydındır - o, ilə inteqrasiya edəcək GPT-4 üçün ChatGPT+ abunəçilər.
Hal-hazırda, DALL-E 3-ün vizualları bir qədər az olaraq qalır. Heç bir kod bazası, blog yazısı və ya ən müasir (SOTA) ilə ətraflı müqayisə yoxdur. OpenAI kartlarını sinələrinə yaxın saxladıqları görünür.
Modelin sələfləri ilə müqayisədə nüansları və təfərrüatları daha dərindən dərk etdiyi vurğulanır. Bu o deməkdir ki, yaradıcı konsepsiyalarınızı yüksək dəqiqliklə təsvirlərə çevirməyin daha hamar bir proses olacağı gözlənilir.
DALL-E 3-ün maraqlı vədlərindən biri onun inteqrasiyasıdır ChatGPT. Bu o deməkdir ki, istifadəçilər mürəkkəb göstərişlər hazırlamaqla məşğul olmağa ehtiyac duymayacaqlar; qısa təsviri ilə kifayətlənməlidir ChatGPT sizin adınıza məharətlə ətraflı göstərişlər yaratmaq.
OpenAI uzun sorğularda kontekstin vacibliyini də vurğulamışdır. DALL-E 3 geniş izahatlarda təsvir olunan kontekstlə daha çox uyğunlaşaraq, təfərrüatlılığı əhatə etmək üçün nəzərdə tutulmuşdur.
Bununla belə, hər hansı yeni AI modelində olduğu kimi, bilinməyən bir element də var. İlk baxışlar perspektivli görünsə də, əsl lakmus testi uzun müddət istifadə ilə gələcək. Onun səmərəliliyi və işləmə sürəti ilə bağlı suallar qalır.
Çox güman ki, DALL-E 3 çox mərhələli diffuziya prosesi olacaq GPT-4 mətn kodlayıcısı kimi xidmət edir. Bu quruluşun mürəkkəb mexanikası məxfilik içində qala bilər.
DALL-E 3-ə giriş üçün vaxt qrafiki ilkin olaraq oktyabr ayına təyin edilmişdir ChatGPT Üstəlik və ChatGPT Müəssisə istifadəçisis, bundan sonra tədqiqatçılar üçün daha geniş çıxış imkanı ilə.
Nuances və senzura DALL-E 3
DALL-E 3-ün inkişafının əsas mərkəz nöqtələri onun imkanlarını məhdudlaşdırmaq üçün ciddi proses idi. Bu, xüsusi məzmun növlərini istisna etmək üçün nəzərdə tutulmuş ciddi uyğunlaşdırma və filtrləri əhatə edirdi. Məsələn, model məşhur şəxsiyyətlərin şəkillərini yaratmaqdan, tanınmış rəssamların üslubunda sənət əsərlərini təkrarlamaqdan və ya təhlükəli hesab edilən məzmun yaratmaqdan qəti şəkildə imtina edir. OpenAInin fərqli standartları. Bu strateji yanaşma yalnız məhdudiyyətlərlə bağlı deyil; bu, şirkəti potensial hüquqi çaxnaşmalardan qorumağa yönəlmiş proaktiv tədbirdir.
Bununla belə, bu filtrlərdən və düzülmələrdən kənarda bəzi maraqlı müşahidələr üzə çıxır. DALL-E 3 fotorealist məzmun yaratmağa gəldikdə müəyyən bir zəiflik nümayiş etdirir. Həqiqi fotoşəkilləri qüsursuz şəkildə təqlid edən şəkillər yaratmaq əvəzinə, çıxış fərqli stilizə edilmiş keyfiyyət daşıyır. Süni intellektlə hazırlanmış bu şəkillər, demək olar ki, işlənmiş və bir qədər plastik görünüş verir. Hətta açıq şəkildə "fotoşəkil" sözü ilə istənildikdə belə, nəticə xarakterik stilizasiyasında möhkəm qalır.
Qeyd etmək lazımdır ki, bu özəlliklərə baxmayaraq, DALL-E 3 diqqətəlayiq potensiala nəzər salır. Yaradıcılıqları arasında bəzi nümunələr fotoşəkillərlə təəccüblü bir oxşarlıq nümayiş etdirir. Nəzərə almaq lazımdır ki, bu şəkillərin simulyasiya edilmiş realizmi, xüsusən də suyun altında qaldıqda eyni mövzunun əsl fotoşəkilinin necə görünəcəyi ilə uyğun gəlmir.
DALL-E 3 Xüsusiyyətləri və Təfərrüatları
Gəlin bu yeni modelin həqiqətən nə təklif etdiyini başa düşmək üçün pikselləri nəzərdən keçirək və sətirlər arasında oxuyaq.
Stilizasiya sənəti: nəzər salır OpenAIInstagram hesabı, incə stilizasiya ilə xarakterizə olunan çoxlu sənət əsərlərini görəcəksiniz. Mücərrəd kompozisiyaların və dizaynların təsirli bir sırası olsa da, model fotoreal məzmun istehsal etməkdən çəkinir. Burada vurğu reallığı təqlid etmək deyil, estetika və yaradıcılığa yönəlib.
Bədii Məhdudiyyətlər: DALL-E 3 sələfindən fərqli bir yol tutur. O, müəyyən rəssamların üslublarını təqlid edə bilən DALL-E 2-dən kəskin şəkildə ayrılan canlı rəssamların üslubunda təsvirlər yaratmaqdan qəti şəkildə imtina edir. Bu, yaradıcı cəmiyyətdə ilıq qəbula bənzər qaşlar qaldıra bilər Stable Diffusion 2.0.
Rəssamların Gücləndirilməsi: Sənətçilərin hüquqlarına hörmət etmək üçün, OpenAI rəssamlara işlərini gələcək DALL-E versiyalarından çıxarmağa imkan verir. Rəssamlar hüquqlarına malik olduqları şəkli təqdim etməklə onun modelin çıxışından xaric edilməsini tələb edə bilərlər. DALL-E-nin gələcək iterasiyaları daha sonra oxşar məzmun yaratmaqdan qaçacaq rəssam üslubu.
Təhlükəsizlik və Senzura: OpenAInin təhlükəsizliklə bağlı paranoyası hiss olunur. Onlar modelin təhlükəsizliyini sınamaq üçün xarici “qırmızı komandalarla” əməkdaşlıq etdilər və modelə açıq və ya zərərli məzmuna səbəb ola biləcək xüsusi sözlərə məhəl qoymamağı öyrətmək üçün giriş təsnifatlarından istifadə etdilər. DALL-E 3 şəkillərini yenidən yaratmaqdan çəkinir ictimai xadimlər onların adları açıq-aydın çəkildikdə. Məşhurların bu kateqoriyaya aid olub-olmaması qeyri-müəyyən olaraq qalır və bu, yaradılan üzlərin keyfiyyətinə potensial təsir göstərir.
Su nişanları və İzləmə: “AI tərəfindən yaradılan şəkilləri” izləmək üçün teqlərin daxil edilməsinə dair ipucu var ki, bu, daha yaxşı monitorinqə və yaradılan məzmunun potensial olaraq su nişanına keçidə işarə edir.
Mətn və Əllər Təkmilləşdi: OpenAI Rəqiblər arasında ümumi iddia olan mətn yaratmağı və əl ilə göstərməyi təkmilləşdirir. Əsl sınaq, albalı seçilmiş nümunələrdən kənarda faktiki çıxışda yatır.
Məkan anlayışı: DALL-E 3 göstərişlərdə təsvir edilən məkan münasibətlərini başa düşməkdə üstündür. Bu, modelin mürəkkəb bucaqlar və kompozisiyalar yaratmaq qabiliyyətini artırır, baxmayaraq ki, istifadəçilər bu vədin daha konkret sübutunu gözləyirlər.
Təkliflərin Gücü: Məhz DALL-E3 operativ imkanları və inteqrasiyası ilə bağlıdır ChatGPT. O, avtomatlaşdırma, sürət və operativ dizaynın sadələşdirilməsini vəd edir. Burada tendensiya doğrudur chatGPT göstərişlər yaratmaq, qeyri-müəyyən fikirləri və ya ibtidai göstərişləri bəlağətli olanlara çevirmək. DALL-E 3-ün təkmilləşdirilmiş kontekstli anlayışı istifadəçilərə genişlikdən çox niyyətə diqqət yetirməyə imkan verən prosesi asanlaşdırır.
Uncharted Territories: Müzakirələrdə nəzərəçarpacaq dərəcədə olmayan rəngləmə, rəngləmə, generativ doldurma və 3D modelləşdirmə kimi aspektlərdir. Bu xüsusiyyətlərin olmaması, xüsusən daha çox yönlü modellərə öyrəşmiş istifadəçilər üçün bir məhdudiyyət ola bilər.
Giriş məlumatları: DALL-E 3 əlçatan olmağa hazırlanıb ChatGPT Oktyabrın əvvəlində Plus və Enterprise müştəriləri. Ancaq kreditlərin ayrılması ilə bağlı xüsusiyyətlər ChatGPT Üstəlik istifadəçilər və əlaqədar xərclər qeyri-müəyyən olaraq qalır. Giriş API və vasitəsilə təmin ediləcək OpenAI Laboratoriya platforması "sonra payızda".
İnteqrasiya bacarığı: DALL-E partnyor və Microsoft məhsullarına qüsursuz şəkildə inteqrasiya ediləcək. Təqdimatların, illüstrasiyaların, dizaynların, loqoların hamısı kontekstdə və dəstəyi ilə gücləndirilməsinin şahidi olmağı gözləyin. ChatGPT. Bu inteqrasiya, kimi rəqiblər üçün əhəmiyyətli bir problem yaradaraq, əsas istiqamətə çevriləcək Bard ilə Google və İdeoqram.
LLM və vizual məzmunun yaxınlaşması: Ən maraqlı cəhət Böyük Dil Modelləri (LLM) və vizual məzmun yaratma modellərinin konvergensiyasındadır. Bu, mürəkkəb operativ mühəndislikdən fikirləri daha əlçatan dildə ifadə etməyə keçidi bildirir. Süni intellekt bu ifadələrdən kontekst və ideyalar toplayaraq qarşısıalınması çətin olan yaradıcı imkanlar təqdim edəcək.
əlaqədar: Süni İncəsənət Generatorları üçün Ən Yaxşı 50 Mətndən Şəkilə Təkliflər Midjourney və DALL-E |
DALL-E 3: AI Image Generation-da Yeni Lider olun
OpenAI's DALL-E 3-ə inteqrasiya etmək qərarı ChatGPT ekosistem strateji bir addımdır. Bu inteqrasiya DALL-E 3-ə 100 milyon aktiv istifadəçidən ibarət geniş istifadəçi məlumat bazasına giriş imkanı verir. Bu addım DALL-E 3-ün əlçatanlığını əhəmiyyətli dərəcədə artırır və onun populyarlığını katapult etmək potensialına malikdir.
Hal-hazırda, Midjourney və Stable Diffusion ətrafında öyünmək 15 milyon qeydiyyatdan keçmiş istifadəçi. Bununla belə, bu inteqrasiya ilə DALL-E 3 on qat daha böyük istifadəçi bazasına - 100 milyon istifadəçiyə çıxış əldə etmək üçün qurulmuşdur. Bu edir ChatGPT Plus abunə planı daha cəlbedici edin, çünki o, chatbot-a, analitik alətlərə və təsvirin yaradılmasına, hamısını münasib qiymətə təklif edir.
İnteqrasiya təkcə mövcud istifadəçilər üçün sərfəli deyil, həm də yeni istifadəçilər üçün güclü maqnit rolunu oynayır. Genişləndirir OpenAI ekosistemin əhatə dairəsi və populyarlığı, süni intellekt tərəfindən yaradılan məzmun həlləri axtaran şəxsləri cəlb edir.
Bu strateji addım təkan verməyə hazırdır OpenAIgəliri və digər əsas göstəricilər. Şirkətin investorları çox güman ki, bu inkişafa müsbət baxacaqlar, xüsusən də son zamanlar Trafik həcmində 20% azalma yay ərzində.
Daha çox əlaqəli mövzuları oxuyun:
Məsuliyyətdən imtina
uyğun olaraq Güvən Layihəsi qaydaları, lütfən nəzərə alın ki, bu səhifədə təqdim olunan məlumat hüquqi, vergi, investisiya, maliyyə və ya hər hansı digər məsləhət forması kimi təfsir edilməməlidir və təfsir edilməməlidir. Yalnız itirə biləcəyiniz şeyə investisiya qoymaq və hər hansı bir şübhəniz varsa, müstəqil maliyyə məsləhətləri axtarmaq vacibdir. Əlavə məlumat üçün biz emitent və ya reklamçı tərəfindən təmin edilən şərtlər və şərtlərə, həmçinin yardım və dəstək səhifələrinə müraciət etməyi təklif edirik. MetaversePost dəqiq, qərəzsiz hesabat verməyə sadiqdir, lakin bazar şərtləri xəbərdarlıq edilmədən dəyişdirilə bilər.
Müəllif haqqında
Damir komanda rəhbəri, məhsul meneceri və redaktordur Metaverse Post, AI/ML, AGI, LLMs, Metaverse və kimi mövzuları əhatə edir Web3- əlaqəli sahələr. Onun məqalələri hər ay bir milyondan çox istifadəçinin kütləsini cəlb edir. O, SEO və rəqəmsal marketinq sahəsində 10 illik təcrübəyə malik mütəxəssis kimi görünür. Damirin adı Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto və digər nəşrlər. O, rəqəmsal köçəri kimi BƏƏ, Türkiyə, Rusiya və MDB arasında səyahət edir. Damir fizika üzrə bakalavr dərəcəsi qazandı və onun fikrincə, bu, ona internetin daim dəyişən mənzərəsində uğur qazanmaq üçün lazım olan tənqidi düşünmə bacarıqlarını verdi.
Ətraflı məqalələrDamir komanda rəhbəri, məhsul meneceri və redaktordur Metaverse Post, AI/ML, AGI, LLMs, Metaverse və kimi mövzuları əhatə edir Web3- əlaqəli sahələr. Onun məqalələri hər ay bir milyondan çox istifadəçinin kütləsini cəlb edir. O, SEO və rəqəmsal marketinq sahəsində 10 illik təcrübəyə malik mütəxəssis kimi görünür. Damirin adı Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto və digər nəşrlər. O, rəqəmsal köçəri kimi BƏƏ, Türkiyə, Rusiya və MDB arasında səyahət edir. Damir fizika üzrə bakalavr dərəcəsi qazandı və onun fikrincə, bu, ona internetin daim dəyişən mənzərəsində uğur qazanmaq üçün lazım olan tənqidi düşünmə bacarıqlarını verdi.