Dall-E 3 срещу. Midjourney: Голямо сравнение на най-напредналите AI арт генератори
Присъединете се към нас в това вълнуващо пътешествие, докато изследваме Dall-E 3 и Midjourneyтънкостите, сложността и неизползвания потенциал. Тази статия подчертава най-интригуващите сравнения, базирани на изследване, направено от AI ентусиаста Atachkina; ако се интересувате да научите повече, щракнете върху връзка.
Професионални съвети |
---|
1. Разкрийте Топ 50 подкани за текст към изображение за AI Art Generators Midjourney и DALL-E. |
2. Разпалете креативността си с Топ 20 AI генератори на текст към изображение на 2023. |
Тази статия предоставя подкана за текст към изображение, изображение, показващо резултатите от Dall-E 3 и Midjourneyи обяснение на разликите между двете генератори на изкуство. Нека да започнем.
И двете невронни мрежи се представиха чудесно в този случай, с Midjourney леко превъзхождащ останалите.
Dall-E 3 свърши много по-лоша работа тук; получи ярките цветове на стиловете, но не и яснотата на детайлите; на заден план се появиха деформирани тела, а лицата не бяха никак сполучливи.
И двете места се оказаха интересни, но Dall-E 3 отново се затрудни с лицата. Вместо това направи плюшена бежова чанта, както е указано в подканата, и Midjourney го пренебрегна. В този случай Dall-E 3 беше много послушен при изпълнението на подканата.
И още веднъж, докато и двете мрежи правят отлични колажи, Dall-E 3 е по-верен на подканата; добави само посочените от нас герои, не можа да се превърне в жокер и кръстоса капитана с Батман.
Midjourney успя да комбинира съответните стилове на двамата художници от подканата, докато Dall-E 3 просто добави много натоварени детайли и ярки цветове към фона.
Още веднъж, котките са в топ форма и двете невронни мрежи разбират перфектно филмовите камери. Въпреки това, Dall-E 3 дори добавя зърнистост към снимките.
Dall-E 3 създаде младия Леонардо Ди Каприо със страхотни текстури на джъмпера, добави зърнистост на филма и цветова схема и много готино отразява усещането за руска дача. Midjourney беше добър цветен отражател за филма и Ди Каприо й придаде по-зрял вид.
Въпреки че и двете невронни мрежи са умели в създаването на колажи, ако се вгледате внимателно, Midjourney изкривява лицата и някои форми на предмети, докато Dall-E 3 е по-точен в изпълнението на самите герои - дори се оказа, че е Чубака.
Когато увеличите мащаба на снимките, ще забележите, че Dall-E 3 има замъглени очи; Midjourney, от друга страна, е безупречен. Dall-E 3 също предписва марка; змиите на главите изглеждат по-живи и в движение; Midjourney винаги ги прави легнали, а не на главата.
И двете са готини, но Midjourney взе предвид стила на художника, както и ефекта на филмова камера, докато Dall-E 3 игнорира кадъра в цял ръст и не го взе предвид.
Взехме решение да тестваме и снимка с феи, но Dall-E 3 упорито отказа да ни сътрудничи. Midjourney не пренебрегна крилата, защото препратката с крила беше добавена. Когато Dall-E 3 направи снимка, тя предложи някои интригуващи възможности, но с американка.
Midjourney свършиха фантастична работа, но искаме да обърнем специално внимание на това как Dall-E 3 създаде филмовите ефекти в горната дясна снимка и добави собствен бял почерк; страхотно се получи.
Dall-E 3 успя много послушно да реализира всички герои на подканата в едно изображение още веднъж. Midjourney много се стараеше и дори беше близо до успеха.
На пръв поглед изглежда, че и двете са добри, но по-внимателно вглеждане разкрива, че Dall-E 3 няма фотореалистичен обем и че Midjourney обработих ставите с вилици с гръм и трясък.
И двата генератора са опитни в съответните си области, като Dall-E 3 превъзхожда текста и Midjourney превъзходен във фотореализма.
Физиката и геометрията на сешоарите са трудни за Midjourney. Можете да прекарате много време в опити и препратки и понякога резултатите приличат на сешоар, но Dall-E 3 даде приемлив резултат от първия опит и дори написа текста.
Единственото око е добро, но това е друга история. в Midjourney, написахме отрицателна подкана – без карикатура, илюстрация, плосък, две очи. Dall-E 3 веднага се подчини и направи едно око, усмивка и шапка, но категорично отказа да позволи на някой да я снима.
Midjourney направиха поколението да не прилича на Брад, затова използвахме допълнителната услуга Insight Face Swap да постави лицето на Брад върху поколението; имаше публикация за това тук. Dall-E 3 знае кой е Брад Пит и може да рисува звезди без допълнителен софтуер.
И двете мрежи са добри, но Dall-E 3 може да създава рога на еднорог Midjourney обикновено не може.
Dall-E 3 свърши добра работа за поставяне на героите в действие; можем да видим орк и елф с елфски уши. Има и човек с анцуг Nike, но очите му са размазани. Елфическите заострени уши се игнорират предимно от Midjourney, и Nike също е пренебрегнат.
Когато послескриптът „илюстрация“ първоначално беше пропуснат от подканата, Dall-E 3 създаде такава. Тогава решихме да го сравним с Midjourneyилюстрация на. Докато Midjourney приличаше повече на илюстрациите от съветската епоха и не включваше крилете на феите, Dall-E 3 свърши фантастична работа с рисуването на сърпа и чука. Примерът вдясно показва как Dall-E 3 може да изглежда в текста.
Въпреки това, Midjourney отиде във фотореализма; няма главен герой в изображенията, само околностите, но все пак готино. Dall-E 3 не искаше отново да е на снимката.
Dall-E 3 срещу. Midjourney: Предимства и недостатъци
Тъй като потребителите изследват тази технология, няколко забележителни силни страни и ограничения излязоха наяве, хвърляйки по-нататъшно вникване в нейната функционалност.
Плюсове:
- Бързо подчинение: Една от забележителните характеристики на Dall-E 3 е неговата забележителна способност да следва точно указанията. Потребителите съобщават, че AI моделът реагира ефективно на широк диапазон от входни данни, което го прави универсален инструмент за различни задачи.
- Многостранно творчество: Dall-E 3 показва способността да изобразява множество герои в рамките на едно изображение, разширявайки своя потенциал за разказване на истории и творчески проекти. Този многостранен подход подобрява неговата полезност в различни области.
- Текстова интеграция: Потребителите отбелязаха умението на Dall-E 3 да интегрира безпроблемно текст в изображения. Тази функция улеснява създаването на визуално ангажиращо съдържание с вградени текстови елементи.
Минуси:
- Ясност на изображението: Забележимо ограничение е тенденцията на AI да създава изображения с размазани лица и очи. Въпреки че се отличава с креативност, понякога му липсва яснотата и прецизността, които се виждат в генерираното от човека съдържание.
- Съгласуваност на стила: Dall-E 3 не възпроизвежда последователно стиловете на конкретни артисти, което може да е недостатък за тези, които търсят прецизна артистична емулация.
- Изискване за VPN: Достъпът до Dall-E 3 в момента налага използването на VPN, което може да създаде предизвикателства за достъпността за някои потребители.
- Управление на изображения: Потребителите са се натъкнали на ограничения при управлението на генерирани изображения на уебсайта на Microsoft Bing. Трябва да се отбележи, че няма функция за ориентация на формата и хронологията на изображенията е ограничена до скорошни качвания, което налага незабавно копиране за по-късна употреба.
- Скорост на генериране: В някои случаи се съобщава, че процесът на генериране в Dall-E 3 е по-бавен в сравнение с други модели с изкуствен интелект.
Въпреки тези ограничения, Dall-E 3 има значителни обещания. Потребителите и експертите признават неговия потенциал да революционизира създаването на съдържание и разказването на истории. Като OpenAI продължава да усъвършенства и разширява своите предложения, очаква се силните страни на Dall-E 3 да блестят още по-ярко, което го прави ценен инструмент в различни области.
Въпроси и Отговори
Както Dall-E 3, така и Midjourney имат своите силни и слаби страни. Dall-E 3 е особено послушен на подкани и може да интегрира безпроблемно текст в изображения. Въпреки това, понякога създава изображения със замъглени лица и очи и може да не възпроизвежда последователно стиловете на конкретни артисти. От друга страна, Midjourney се отличава с фотореализъм, но не винаги може да улови същността на определени подкани толкова точно, колкото Dall-E 3.
Статията предоставя подкани за текст към изображение, показвайки резултатите както от Dall-E 3, така и от Midjourney, и обяснява разликите между двата арт генератора.
И двата AI модела имат своите силни и слаби страни. Например, в подкана за космонавт на Юпитер, Midjourney леко надмина Dall-E 3. Въпреки това, в друга подкана за Wonder Woman, Dall-E 3 беше по-точен в улавянето на същността на подканата.
- Бързо подчинение: Dall-E 3 точно следва подканите.
- Многостранно творчество: Може да изобразява множество герои в едно изображение.
- Текстова интеграция: Dall-E 3 може безпроблемно да интегрира текст в изображения.
- Яснота на изображението: Понякога създава изображения със замъглени лица и очи.
- Последователност на стила: Dall-E 3 не възпроизвежда последователно стиловете на конкретни артисти.
- Управление на изображения: Има ограничения при управлението на генерирани изображения на уебсайта на Microsoft Bing.
- Скорост на генериране: Процесът на генериране на Dall-E 3 може да бъде по-бавен в сравнение с други модели с изкуствен интелект.
Отказ от отговорност
В съответствие с Доверете се насоките на проекта, моля, имайте предвид, че предоставената на тази страница информация не е предназначена да бъде и не трябва да се тълкува като правен, данъчен, инвестиционен, финансов или каквато и да е друга форма на съвет. Важно е да инвестирате само това, което можете да си позволите да загубите, и да потърсите независим финансов съвет, ако имате някакви съмнения. За допълнителна информация предлагаме да се обърнете към правилата и условията, както и към страниците за помощ и поддръжка, предоставени от издателя или рекламодателя. MetaversePost се ангажира с точно, безпристрастно отчитане, но пазарните условия подлежат на промяна без предизвестие.
За автора
Дамир е ръководител на екип, продуктов мениджър и редактор в Metaverse Post, обхващащи теми като AI/ML, AGI, LLMs, Metaverse и Web3- свързани полета. Статиите му привличат огромна аудитория от над милион потребители всеки месец. Изглежда, че е експерт с 10 години опит в SEO и дигитален маркетинг. Дамир е споменат в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и други публикации. Той пътува между ОАЕ, Турция, Русия и ОНД като дигитален номад. Дамир получава бакалавърска степен по физика, която според него му е дала уменията за критично мислене, необходими за успех в непрекъснато променящия се пейзаж на интернет.
Още статииДамир е ръководител на екип, продуктов мениджър и редактор в Metaverse Post, обхващащи теми като AI/ML, AGI, LLMs, Metaverse и Web3- свързани полета. Статиите му привличат огромна аудитория от над милион потребители всеки месец. Изглежда, че е експерт с 10 години опит в SEO и дигитален маркетинг. Дамир е споменат в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и други публикации. Той пътува между ОАЕ, Турция, Русия и ОНД като дигитален номад. Дамир получава бакалавърска степен по физика, която според него му е дала уменията за критично мислене, необходими за успех в непрекъснато променящия се пейзаж на интернет.