AI Wiki Изкуство / КАРТИНИ Технологии
Октомври 02, 2023

Dall-E 3 срещу. Midjourney: Голямо сравнение на най-напредналите AI арт генератори

Присъединете се към нас в това вълнуващо пътешествие, докато изследваме Dall-E 3 и Midjourneyтънкостите, сложността и неизползвания потенциал. Тази статия подчертава най-интригуващите сравнения, базирани на изследване, направено от AI ентусиаста Atachkina; ако се интересувате да научите повече, щракнете върху връзка.

Dall-E 3 срещу. Midjourney: Голямо сравнение на най-напредналите AI арт генератори
Професионални съвети
1. Разкрийте Топ 50 подкани за текст към изображение за AI Art Generators Midjourney и DALL-E.
2. Разпалете креативността си с Топ 20 AI генератори на текст към изображение на 2023.

Тази статия предоставя подкана за текст към изображение, изображение, показващо резултатите от Dall-E 3 и Midjourneyи обяснение на разликите между двете генератори на изкуство. Нека да започнем.

подсказка: Космонавт стои на Юпитер и наблюдава изгрева. футуристичен интерфейс, перспектива от първо лице, космически командир, дъждомер и HUD Rise UI

И двете невронни мрежи се представиха чудесно в този случай, с Midjourney леко превъзхождащ останалите.

подкана: заснет от Slim Aarons на Wonder Woman в стаята, сложни слоеве и текстури, подробен дизайн на героите, фон с ярки, причудливи и цветни сцени, корекция на пастелни цветове като филми на Уес Андерсън, зърнистост на филма и Tokina AT-X 11-16mm f /2.8 pro dx ii

Dall-E 3 свърши много по-лоша работа тук; получи ярките цветове на стиловете, но не и яснотата на детайлите; на заден план се появиха деформирани тела, а лицата не бяха никак сполучливи.

подкана: снимка на сладък, пълничък киберкот в неговата онлайн резиденция
подсказка: професионална комерсиална фотография в студио за Nike; модел с дълга коса; изстрел на цялото тяло; облечен в бежова тениска Nike; необичайно дънково яке Nike; мека бежова плюшена чанта nike; меки лилави маратонки nike; стои на светло розово-син фон; футуристичен фон със сложна опростена форма с подсветка; заснет на Hasselblad X1D;

И двете места се оказаха интересни, но Dall-E 3 отново се затрудни с лицата. Вместо това направи плюшена бежова чанта, както е указано в подканата, и Midjourney го пренебрегна. В този случай Dall-E 3 беше много послушен при изпълнението на подканата.

подкана: фигура с балон с проследяване на лъчи в пастелни цветове, женска скулптура с метални покрития, лъскава/лъскава, жизнена турбуленция, сърцевина на гълъб, нетрадиционни пози, анаморфно изкуство, преливане/опалесценция, вериги за видео обратна връзка, лъскави очи, смели извивки, лъскав, течен фигуратизъм
подкана: винтидж ретро колаж от супергерои, включително Wonder Woman, Captain America, Batman и The Joker

И още веднъж, докато и двете мрежи правят отлични колажи, Dall-E 3 е по-верен на подканата; добави само посочените от нас герои, не можа да се превърне в жокер и кръстоса капитана с Батман.

подкана: метално петно ​​за проследяване на лъчи, анаморфно изкуство, привличащи вниманието детайли, прецизни линии, смели криви, лъскав, течен фигуратизъм, пастелни цветове, тъмен фон
подкана: Опростени слоеве и текстури, сложен дизайн на персонажи, ярки, причудливи и цветни фонове, корекция на пастелни цветове като филмите на Уес Андерсън, зърнистост на филма и обектив Tokina at-x 11-16mm f/2.8 pro dx ii са налични в това изображение на Спайдърмен, релаксиращ на диван, направено от Слим Арънс.

Midjourney успя да комбинира съответните стилове на двамата художници от подканата, докато Dall-E 3 просто добави много натоварени детайли и ярки цветове към фона.

подсказка: Снимка от 80-те години на пълнички сладки дебели котки, участващи в клас по аеробика, докато носят забавни леопардови клинове и розови бодита, е направена на Kodak Gold 200.

Още веднъж, котките са в топ форма и двете невронни мрежи разбират перфектно филмовите камери. Въпреки това, Dall-E 3 дори добавя зърнистост към снимките.

През 1990-те години на миналия век Леонардо ди Каприо играе майстор джедай в руска дача, докато държи светлинен меч и носи плетен зелен пуловер.

Dall-E 3 създаде младия Леонардо Ди Каприо със страхотни текстури на джъмпера, добави зърнистост на филма и цветова схема и много готино отразява усещането за руска дача. Midjourney беше добър цветен отражател за филма и Ди Каприо й придаде по-зрял вид.

подкана: колаж от Star Wars изображения във винтидж ретро стил

Въпреки че и двете невронни мрежи са умели в създаването на колажи, ако се вгледате внимателно, Midjourney изкривява лицата и някои форми на предмети, докато Dall-E 3 е по-точен в изпълнението на самите герои - дори се оказа, че е Чубака.

подкана: снимка на руска горгона медуза, облечена в улично облекло Balenciaga hypebeast и се разхожда по улица в Манхатън със змии вместо коса

Когато увеличите мащаба на снимките, ще забележите, че Dall-E 3 има замъглени очи; Midjourney, от друга страна, е безупречен. Dall-E 3 също предписва марка; змиите на главите изглеждат по-живи и в движение; Midjourney винаги ги прави легнали, а не на главата.

Подсказка: Тази наградена снимка от Слим Арънс показва човек-паяк, маскиран като фея, облечен в розова пухкава рокля и държащ вълшебна пръчка. Снимано е с фотоапарат Fuji Superia X-TRA 800.

И двете са готини, но Midjourney взе предвид стила на художника, както и ефекта на филмова камера, докато Dall-E 3 игнорира кадъра в цял ръст и не го взе предвид.

подсказка: фея на СССР с крила и костюм на космонавт

Взехме решение да тестваме и снимка с феи, но Dall-E 3 упорито отказа да ни сътрудничи. Midjourney не пренебрегна крилата, защото препратката с крила беше добавена. Когато Dall-E 3 направи снимка, тя предложи някои интригуващи възможности, но с американка.

подкана: охлюв, позиращ за портрет, облечен в съвременно хипстърско облекло, 4K сложни слоеве и текстури, подробен дизайн на героите и зърнистост на филма. Фонът включва живи, причудливи и цветни сцени.

Midjourney свършиха фантастична работа, но искаме да обърнем специално внимание на това как Dall-E 3 създаде филмовите ефекти в горната дясна снимка и добави собствен бял почерк; страхотно се получи.

подкана: Спайдърмен, Батман и Железният човек се събраха на бира в бар.

Dall-E 3 успя много послушно да реализира всички герои на подканата в едно изображение още веднъж. Midjourney много се стараеше и дори беше близо до успеха.

Подсказка: лятна салата от домати и краставици, макро, пълна сцена, топли цветове, висококачествен фотореалистичен хиперреалистичен, естествено осветление, Unreal Engine 5, градиране на цветовете, редакционна фотография, фотография, фотосесия, висок, епичен, artgerm, заснет със 70 mm обектив, дълбочина на полето, DOF, замъгляване на наклона, скорост на затвора 1/1000, F/22, баланс на бялото, 32k, супер разделителна способност

На пръв поглед изглежда, че и двете са добри, но по-внимателно вглеждане разкрива, че Dall-E 3 няма фотореалистичен обем и че Midjourney обработих ставите с вилици с гръм и трясък.

подсказка: Макдоналдс в стила на въображаеми космически пейзажи с реалистични човешки фигури, две коли и трактор, с луна над него. Les Nasbis, Pierre Pellegrini, научно базирана, пионерска смела наситеност, firecore

И двата генератора са опитни в съответните си области, като Dall-E 3 превъзхожда текста и Midjourney превъзходен във фотореализма.

Сешоарът BaByliss D570DE се използва в модерен интериор с вечерно осветление, индустриален дизайн и пастелни цветове, идеален за снимане в студио.

Физиката и геометрията на сешоарите са трудни за Midjourney. Можете да прекарате много време в опити и препратки и понякога резултатите приличат на сешоар, но Dall-E 3 даде приемлив резултат от първия опит и дори написа текста.

подкана: снимка на еднооката Туранга Лила от футурама

Единственото око е добро, но това е друга история. в Midjourney, написахме отрицателна подкана – без карикатура, илюстрация, плосък, две очи. Dall-E 3 веднага се подчини и направи едно око, усмивка и шапка, но категорично отказа да позволи на някой да я снима.

Актьорът Брад Пит е видян през 1990-те години на миналия век да напоява лехите със зеленчукова градина в руска дача, докато носи раиран потник и спортни панталони от adidas. Сцената е заснета с Agfa Vista 400.

Midjourney направиха поколението да не прилича на Брад, затова използвахме допълнителната услуга Insight Face Swap да постави лицето на Брад върху поколението; имаше публикация за това тук. Dall-E 3 знае кой е Брад Пит и може да рисува звезди без допълнителен софтуер.

подкана: красиво момиче, еднорози, технологии на ябълка и ретро ретро колаж от галактики

И двете мрежи са добри, но Dall-E 3 може да създава рога на еднорог Midjourney обикновено не може.

подкана: сладолед в ръка, спортно облекло nike и зашеметяващ фантастичен елф, седнал до орк на улична снимка.

Dall-E 3 свърши добра работа за поставяне на героите в действие; можем да видим орк и елф с елфски уши. Има и човек с анцуг Nike, но очите му са размазани. Елфическите заострени уши се игнорират предимно от Midjourney, и Nike също е пренебрегнат.

подсказка: рисунка на фея от СССР, облечена като космонавт

Когато послескриптът „илюстрация“ първоначално беше пропуснат от подканата, Dall-E 3 създаде такава. Тогава решихме да го сравним с Midjourneyилюстрация на. Докато Midjourney приличаше повече на илюстрациите от съветската епоха и не включваше крилете на феите, Dall-E 3 свърши фантастична работа с рисуването на сърпа и чука. Примерът вдясно показва как Dall-E 3 може да изглежда в текста.

подсказка: Вила на Юпитер, орбиталните пръстени на планетата могат да се видят в далечината, извънземно готви барбекю, сложен дизайн на персонажи, ярки, шантави и цветни фонове, корекция на пастелни цветове като филми на Уес Андерсън, зърнист филм и Tokina AT -X 11-16mm f/2.8 Pro dX II обектив

Въпреки това, Midjourney отиде във фотореализма; няма главен герой в изображенията, само околностите, но все пак готино. Dall-E 3 не искаше отново да е на снимката.

подкана: филмово зърно, кучешка храна, сложен дизайн на персонажи, слоеве и текстури, ярки, шантави и цветни сцени на заден план и корекция на пастелни цветове като във филм на Уес Андерсън

Dall-E 3 срещу. Midjourney: Предимства и недостатъци

Тъй като потребителите изследват тази технология, няколко забележителни силни страни и ограничения излязоха наяве, хвърляйки по-нататъшно вникване в нейната функционалност.

Плюсове:

  1. Бързо подчинение: Една от забележителните характеристики на Dall-E 3 е неговата забележителна способност да следва точно указанията. Потребителите съобщават, че AI моделът реагира ефективно на широк диапазон от входни данни, което го прави универсален инструмент за различни задачи.
  2. Многостранно творчество: Dall-E 3 показва способността да изобразява множество герои в рамките на едно изображение, разширявайки своя потенциал за разказване на истории и творчески проекти. Този многостранен подход подобрява неговата полезност в различни области.
  3. Текстова интеграция: Потребителите отбелязаха умението на Dall-E 3 да интегрира безпроблемно текст в изображения. Тази функция улеснява създаването на визуално ангажиращо съдържание с вградени текстови елементи.

Минуси:

  1. Ясност на изображението: Забележимо ограничение е тенденцията на AI да създава изображения с размазани лица и очи. Въпреки че се отличава с креативност, понякога му липсва яснотата и прецизността, които се виждат в генерираното от човека съдържание.
  2. Съгласуваност на стила: Dall-E 3 не възпроизвежда последователно стиловете на конкретни артисти, което може да е недостатък за тези, които търсят прецизна артистична емулация.
  3. Изискване за VPN: Достъпът до Dall-E 3 в момента налага използването на VPN, което може да създаде предизвикателства за достъпността за някои потребители.
  4. Управление на изображения: Потребителите са се натъкнали на ограничения при управлението на генерирани изображения на уебсайта на Microsoft Bing. Трябва да се отбележи, че няма функция за ориентация на формата и хронологията на изображенията е ограничена до скорошни качвания, което налага незабавно копиране за по-късна употреба.
  5. Скорост на генериране: В някои случаи се съобщава, че процесът на генериране в Dall-E 3 е по-бавен в сравнение с други модели с изкуствен интелект.

Въпреки тези ограничения, Dall-E 3 има значителни обещания. Потребителите и експертите признават неговия потенциал да революционизира създаването на съдържание и разказването на истории. Като OpenAI продължава да усъвършенства и разширява своите предложения, очаква се силните страни на Dall-E 3 да блестят още по-ярко, което го прави ценен инструмент в различни области.

Въпроси и Отговори

Както Dall-E 3, така и Midjourney имат своите силни и слаби страни. Dall-E 3 е особено послушен на подкани и може да интегрира безпроблемно текст в изображения. Въпреки това, понякога създава изображения със замъглени лица и очи и може да не възпроизвежда последователно стиловете на конкретни артисти. От друга страна, Midjourney се отличава с фотореализъм, но не винаги може да улови същността на определени подкани толкова точно, колкото Dall-E 3.

Статията предоставя подкани за текст към изображение, показвайки резултатите както от Dall-E 3, така и от Midjourney, и обяснява разликите между двата арт генератора.

И двата AI модела имат своите силни и слаби страни. Например, в подкана за космонавт на Юпитер, Midjourney леко надмина Dall-E 3. Въпреки това, в друга подкана за Wonder Woman, Dall-E 3 беше по-точен в улавянето на същността на подканата.

  • Бързо подчинение: Dall-E 3 точно следва подканите.
  • Многостранно творчество: Може да изобразява множество герои в едно изображение.
  • Текстова интеграция: Dall-E 3 може безпроблемно да интегрира текст в изображения.
  • Яснота на изображението: Понякога създава изображения със замъглени лица и очи.
  • Последователност на стила: Dall-E 3 не възпроизвежда последователно стиловете на конкретни артисти.
  • Управление на изображения: Има ограничения при управлението на генерирани изображения на уебсайта на Microsoft Bing.
  • Скорост на генериране: Процесът на генериране на Dall-E 3 може да бъде по-бавен в сравнение с други модели с изкуствен интелект.

Отказ от отговорност

В съответствие с Доверете се насоките на проекта, моля, имайте предвид, че предоставената на тази страница информация не е предназначена да бъде и не трябва да се тълкува като правен, данъчен, инвестиционен, финансов или каквато и да е друга форма на съвет. Важно е да инвестирате само това, което можете да си позволите да загубите, и да потърсите независим финансов съвет, ако имате някакви съмнения. За допълнителна информация предлагаме да се обърнете към правилата и условията, както и към страниците за помощ и поддръжка, предоставени от издателя или рекламодателя. MetaversePost се ангажира с точно, безпристрастно отчитане, но пазарните условия подлежат на промяна без предизвестие.

За автора

Дамир е ръководител на екип, продуктов мениджър и редактор в Metaverse Post, обхващащи теми като AI/ML, AGI, LLMs, Metaverse и Web3- свързани полета. Статиите му привличат огромна аудитория от над милион потребители всеки месец. Изглежда, че е експерт с 10 години опит в SEO и дигитален маркетинг. Дамир е споменат в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и други публикации. Той пътува между ОАЕ, Турция, Русия и ОНД като дигитален номад. Дамир получава бакалавърска степен по физика, която според него му е дала уменията за критично мислене, необходими за успех в непрекъснато променящия се пейзаж на интернет. 

Още статии
Дамир Ялалов
Дамир Ялалов

Дамир е ръководител на екип, продуктов мениджър и редактор в Metaverse Post, обхващащи теми като AI/ML, AGI, LLMs, Metaverse и Web3- свързани полета. Статиите му привличат огромна аудитория от над милион потребители всеки месец. Изглежда, че е експерт с 10 години опит в SEO и дигитален маркетинг. Дамир е споменат в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и други публикации. Той пътува между ОАЕ, Турция, Русия и ОНД като дигитален номад. Дамир получава бакалавърска степен по физика, която според него му е дала уменията за критично мислене, необходими за успех в непрекъснато променящия се пейзаж на интернет. 

Hot Stories
Присъединете се към нашия бюлетин.
Последни новини

Институционалният апетит нараства към биткойн ETF на фона на волатилност

Оповестяванията чрез документи 13F разкриват забележителни институционални инвеститори, занимаващи се с биткойн ETF, което подчертава нарастващото приемане на...

Научете още

Пристига денят на присъдата: Съдбата на CZ виси на равновесие, докато американският съд разглежда молбата на DOJ

Changpeng Zhao е готов да бъде осъден днес в американски съд в Сиатъл.

Научете още
Присъединете се към нашата иновативна техническа общност
Вижте повече
Прочети повече
Side Protocol стартира Incentivized Testnet и въвежда система за вътрешни точки, позволяваща на потребителите да печелят SIDE точки
пазари Новини Технологии
Side Protocol стартира Incentivized Testnet и въвежда система за вътрешни точки, позволяваща на потребителите да печелят SIDE точки
Май 9, 2024
Web3 и крипто събития през май 2024 г.: Проучване на нови технологии и нововъзникващи тенденции в блокчейн и DeFi
резюме Бизнес пазари Технологии
Web3 и крипто събития през май 2024 г.: Проучване на нови технологии и нововъзникващи тенденции в блокчейн и DeFi
Май 9, 2024
Notcoin ще стартира на OKX Jumpstart, предлага 1.25% от общото предлагане на токени за копаене
пазари Новини Технологии
Notcoin ще стартира на OKX Jumpstart, предлага 1.25% от общото предлагане на токени за копаене
Май 9, 2024
Puffer Finance пуска своята основна мрежа, подобрява включването на оператор на възел за децентрализация на мрежата
Новини Технологии
Puffer Finance пуска своята основна мрежа, подобрява включването на оператор на възел за децентрализация на мрежата
Май 9, 2024
CRYPTOMERIA LABS PTE. LTD.