AI Wiki Art Технологія
Жовтень 02, 2023

Dall-E 3 проти. Midjourney: Велике порівняння найдосконаліших арт-генераторів AI

Приєднуйтесь до нас у цій захоплюючій подорожі, коли ми досліджуємо Dall-E 3 і Midjourneyтонкощі, складності та невикористаний потенціал. Ця стаття висвітлює найбільш інтригуючі порівняння, засновані на дослідженні, проведеному ентузіастом ШІ Атачкіною; якщо вам цікаво дізнатися більше, натисніть link.

Dall-E 3 проти. Midjourney: Велике порівняння найдосконаліших арт-генераторів AI
Про Поради
1. Розкрийте 50 найпопулярніших підказок для перетворення тексту в зображення для AI Art Generators Midjourney і DALL-E.
2. Запаліть свою творчість за допомогою 20 найпопулярніших AI-генераторів тексту в зображення з 2023.

Ця стаття містить підказку для перетворення тексту в зображення, зображення, що показує результати Dall-E 3 і Midjourney, а також пояснення відмінностей між ними генератори мистецтва. Давайте почнемо.

підказка: космонавт стоїть на Юпітері та спостерігає за сходом сонця. футуристичний інтерфейс, перспектива від першої особи, космічний командир, вимірювач дощу та інтерфейс користувача HUD Rise

Обидві нейронні мережі показали чудові результати в цьому випадку з Midjourney трохи перевершує інших.

підказка: зйомка Слімом Ааронсом Диво-жінки в кімнаті, складні шари та текстури, детальний дизайн персонажів, фон із яскравими, химерними та барвистими сценами, корекція пастельних кольорів, як у фільмах Уеса Андерсона, зернистість плівки та Tokina AT-X 11-16mm f /2.8 pro dx ii

Тут Dall-E 3 впорався набагато гірше; вона отримала яскраві фарби фасонів, але не чіткість деталей; на задньому плані з'явилися деформовані тіла, а обличчя зовсім не вдалі.

підказка: фото симпатичного, кремезного кіберкота у його онлайн-резиденції
підказка: професійна комерційна фотостудія для Nike; модель з довгим волоссям; зйомка всього тіла; в бежевій футболці Nike; незвичайна джинсова куртка Nike; ніжно-бежева плюшева сумка nike; ніжно-фіолетові кросівки nike; стоячи на світлому рожево-блакитному фоні; футуристичний фон складної обтічної форми з підсвічуванням; знято на Hasselblad X1D;

Цікаво вийшло в обох місцях, але Dall-E 3 знову поборовся з обличчями. Натомість він зробив плюшевий бежевий мішок, як зазначено в підказці, і Midjourney нехтував цим. У цьому випадку Dall-E 3 дуже слухняно виконав підказку.

підказка: бульбашка з трасуванням променів у пастельних кольорах, жіноча скульптура з металевою обробкою, блискуча/глянцева, яскрава турбулентність, голубне ядро, нетрадиційні пози, анаморфне мистецтво, переливи/опалесценція, петлі відеозвороту, блискучі очі, сміливі криві, блискучий, плавний фігуратизм
підказка: вінтажний ретро-колаж із супергероїв, зокрема Чудо-жінку, Капітана Америку, Бетмена та Джокера

І знову, хоча обидві сітки створюють чудові колажі, Dall-E 3 точніше відповідає підказці; він додавав тільки вказаних нами героїв, не міг перетворитися на джокера, і схрестив капітана з Бетменом.

підказка: металева крапка з трасуванням променів, анаморфографія, деталі, що привертають увагу, точні лінії, сміливі криві, блискучий, плавний фігуратизм, пастельні кольори, темне тло
підказка: прості шари та текстури, складний дизайн персонажів, яскраві, химерні та барвисті фони, корекція пастельних кольорів, як у фільмах Уеса Андерсона, зернистість плівки та об’єктив Tokina at-x 11-16mm f/2.8 pro dx ii на цьому зображенні Людини-павука, який відпочиває на дивані, зробленому Слімом Ааронсом.

Midjourney зміг поєднати відповідні стилі двох художників із підказки, тоді як Dall-E 3 просто додав багато насичених деталей і яскравих кольорів на фоні.

підказка: фотографія 80-х років, на якій пухкі симпатичні товсті коти беруть участь у заняттях з аеробіки, одягаючи кумедні леопардові легінси та рожеві боді, була зроблена на Kodak Gold 200.

Знову коти в найкращій формі, і обидві нейронні мережі чудово розуміють плівкові камери. Однак Dall-E 3 навіть додає знімкам зернистість.

1990-ті роки Леонардо Ді Капріо грає майстра-джедая на російській дачі, тримаючи світловий меч і одягнений у в’язаний зелений джемпер.

Dall-E 3 створив молодого Леонардо Ді Капріо з крутими текстурами джемпера, додав зернистість плівки і колірну гамму і дуже круто відобразив відчуття російської дачі. Midjourney була хорошим відбивачем кольору для фільму, і Ді Капріо надав їй більш зрілого вигляду.

підказка: колаж з Зіркові війни зображення у вінтажному стилі ретро

Хоча обидва нейронні мережі вправно створюють колажі, якщо придивитися, Midjourney спотворює обличчя і форми деяких предметів, а Dall-E 3 більш точний у виконанні самих персонажів — виявився навіть Чубакка.

підказка: фото російської медузи горгони в вуличному одязі Balenciaga hypebeast, яка прогулюється вулицею Манхеттена зі зміями замість волосся

Коли ви збільшите масштаб фотографій, ви помітите, що Dall-E 3 має розмиті очі; Midjourney, з іншого боку, бездоганний. Dall-E 3 також прописав бренд; змії на головах здаються більш живими і рухливими; Midjourney завжди робив їх лежачи, а не на голові.

Підказка: на цій нагородженій фотографії Сліма Ааронса зображено людину-павука, переодягнену феєю, у рожевій пухнастій сукні та з чарівною паличкою. Це було зроблено камерою Fuji Superia X-TRA 800.

Обидва класні, але Midjourney враховував стиль художника, а також ефект плівкової камери, тоді як Dall-E 3 проігнорував повний кадр і не врахував його.

підказка: фея СРСР з крилами і в костюмі космонавта

Ми також вирішили протестувати фото з феями, але Dall-E 3 вперто відмовився від співпраці. Midjourney не проігнорував крила, оскільки було додано посилання з крилами. Коли Dall-E 3 зробив знімок, він запропонував кілька інтригуючих можливостей, але з американкою.

підказка: равлик позує для портрета в сучасному хіпстерському вбранні, складні шари та текстури 4K, детальний дизайн персонажів і зернистість плівки. Фон містить яскраві, химерні та барвисті сцени.

Midjourney зробили фантастичну роботу, але ми хочемо звернути особливу увагу на те, як Dall-E 3 створив ефекти плівки на верхньому правому зображенні та додав власний білий почерк; вийшло чудово.

підказка: Людина-павук, Бетмен і Залізна людина зібралися за пивом у барі.

Dall-E 3 зміг дуже слухняно втілити в одне зображення всіх героїв підказки. Midjourney дуже старався і навіть був близький до успіху.

Підказка: Літній салат з помідорів та огірків, макро, повна сцена, теплі кольори, висока якість фотореалістичний гіперреалістичний, природне освітлення, Unreal 5 двигуна, градація кольору, редакційна фотографія, фотографія, фотосесія, високий, епік, artgerm, зйомка об’єктивом 70 мм, глибина різкості, DOF, розмиття під нахилом, витримка 1/1000, F/22, баланс білого, 32k, суперроздільна здатність

На перший погляд здається, що обидва хороші, але при детальнішому розгляді виявляється, що Dall-E 3 не має фотореалістичного об’єму і що Midjourney з тріском обробляв стики вилами.

підказка: McDonald's у стилі образних космічних пейзажів з реалістичними людськими фігурами, двома автомобілями та трактором, а над ним місяць. Les Nasbis, Pierre Pellegrini, науково обґрунтований, новаторська смілива насиченість, firecore

Обидва генератори є досвідченими у своїх галузях, причому Dall-E 3 перевершує текст і Midjourney відзначається фотореалізмом.

Фен BaByliss D570DE використовується в сучасному інтер'єрі з вечірнім освітленням, промисловим дизайном і пастельними кольорами, ідеально підходить для студійної зйомки.

Фізика та геометрія фенів складні Midjourney. Можна витратити багато часу на спроби і посилання, іноді результати нагадують фен, але Dall-E 3 дав прийнятний результат з першої спроби і навіть написав текст.

підказка: фото одноокої Туранга Ліли з футурами

Єдине око добре, але це вже інша історія. в Midjourney, ми написали негативну підказку – без мультфільму, ілюстрації, квартира, два ока. Dall-E 3 миттєво послухався й зробив одне око, посмішку та зняв капелюха, але категорично відмовився дозволити будь-кому сфотографувати її.

Актор Бред Пітт у 1990-х роках поливає грядки на російській дачі в смугастій майці та спортивних штанах від Adidas. Сцена була знята на Agfa Vista 400.

Midjourney зробили покоління не таким, як Бред, тому ми скористалися додатковим сервісом Insight Обмін обличчям показати обличчя Бреда поколінню; тут був пост про це. Dall-E 3 знає, хто такий Бред Пітт, і може малювати зірок без додаткового програмного забезпечення.

підказка: красива дівчина, єдинороги, яблучні технології та вінтажний ретро-колаж із галактик

Обидві сітки хороші, але Dall-E 3 може створювати роги єдинорога Midjourney зазвичай не можна.

підказка: морозиво в руці, спортивний одяг nike та приголомшливий фантастичний ельф, який сидить поруч з орком на вуличному фото.

Dall-E 3 добре впорався із введенням персонажів у дію; ми можемо побачити орка та ельфа з ельфовими вухами. Також є людина в спортивному костюмі Nike, але очі в неї замазані. Ельфійські загострені вуха здебільшого ігноруються Midjourney, і Nike також не враховується.

підказка: малюнок феї СРСР у костюмі космонавта

Коли постскриптум «ілюстрація» спочатку був пропущений у підказці, Dall-E 3 створив її. Тоді ми вирішили порівняти це з Midjourney's ілюстрація. Поки Midjourney більше нагадував ілюстрації радянських часів і не містив крил феї, Dall-E 3 виконав фантастичну роботу, намалювавши серп і молот. Приклад праворуч показує, як Dall-E 3 може виглядати в тексті.

підказка: дача на Юпітері, орбітальні кільця планети видно вдалині, інопланетянин готує шашлик, хитромудрий дизайн персонажів, яскраве, дивне та барвисте тло, корекція пастельних кольорів у стилі фільмів Уеса Андерсона, зернистість плівки та Tokina AT -X 11-16mm f/2.8 Pro dX II об’єктив

Тим не менш, Midjourney пішов у фотореалізм; на картинках немає головного героя, тільки оточення, але все одно круто. Dall-E 3 більше не хотів бути на фото.

підказка: зернистість плівки, корм для собак, складний дизайн персонажів, шари та текстури, яскраві, дивні та барвисті сцени на задньому плані та корекція пастельних кольорів, як у фільмі Уеса Андерсона

Dall-E 3 проти. Midjourney: Плюси і мінуси

Коли користувачі досліджують цю технологію, з’ясовуються кілька помітних сильних сторін і обмежень, що дає змогу краще зрозуміти її функціональність.

Плюси:

  1. Швидка слухняність: Однією з видатних особливостей Dall-E 3 є його чудова здатність точно виконувати підказки. Користувачі повідомили, що модель ШІ ефективно реагує на широкий діапазон вхідних даних, що робить її універсальним інструментом для різних завдань.
  2. Багатогранна творчість: Dall-E 3 демонструє можливість відображати кілька персонажів на одному зображенні, розширюючи його потенціал для оповідання історій і творчих проектів. Цей багатогранний підхід підвищує його корисність у різних областях.
  3. Інтеграція тексту: Користувачі відзначили вміння Dall-E 3 легко інтегрувати текст у зображення. Ця функція полегшує створення візуально привабливого вмісту з вбудованими текстовими елементами.

Мінуси:

  1. Чіткість зображення: Помітним обмеженням є схильність ШІ створювати зображення з розмитими обличчями та очима. Незважаючи на те, що він вирізняється креативністю, йому іноді бракує ясності й точності, які можна побачити у створеному людьми вмісті.
  2. Послідовність стилю: Dall-E 3 не повторює послідовно стилі певних виконавців, що може бути недоліком для тих, хто шукає точного художнього наслідування.
  3. Вимоги до VPN: Доступ до Dall-E 3 наразі вимагає використання VPN, що може створити проблеми з доступністю для деяких користувачів.
  4. Керування зображеннями: Користувачі зіткнулися з обмеженнями під час керування згенерованими зображеннями на веб-сайті Microsoft Bing. Примітно, що немає функції орієнтації формату, а історія зображень обмежена останніми завантаженнями, що вимагає негайного копіювання для подальшого використання.
  5. Швидкість генерації: У деяких випадках повідомлялося, що процес генерації в Dall-E 3 відбувається повільніше порівняно з іншими моделями AI.

Незважаючи на ці обмеження, Dall-E 3 має значні перспективи. Користувачі та експерти визнають його потенціал для революції у створенні контенту та оповіді. як OpenAI продовжує вдосконалювати та розширювати свої пропозиції, очікується, що сильні сторони Dall-E 3 засяють ще яскравіше, що зробить його цінним інструментом у різних сферах.

Питання і відповіді

І Dall-E 3, і Midjourney мають свої сильні та слабкі сторони. Dall-E 3 особливо слухняний до підказок і може легко інтегрувати текст у зображення. Однак іноді він створює зображення з розмитими обличчями та очима та може неповторно відтворювати стилі певних художників. З іншого боку, Midjourney перевершує фотореалізм, але не завжди може передати суть певних підказок так точно, як Dall-E 3.

У статті наведено підказки для перетворення тексту в зображення, демонструючи результати як Dall-E 3, так і Midjourneyі пояснює відмінності між двома генераторами мистецтва.

Обидві моделі ШІ мають свої сильні та слабкі сторони. Наприклад, у підказці про космонавта на Юпітері, Midjourney трохи перевершив Dall-E 3. Однак в іншій підказці про Диво-Жінку Dall-E 3 був точнішим у вловленні суті підказки.

  • Швидка слухняність: Dall-E 3 точно виконує підказки.
  • Багатогранна творчість: може зображати кілька персонажів на одному зображенні.
  • Текстова інтеграція: Dall-E 3 може легко інтегрувати текст у зображення.
  • Чіткість зображення: іноді створює зображення з розмитими обличчями та очима.
  • Послідовність стилю: Dall-E 3 не послідовно повторює стилі певних виконавців.
  • Управління іміджем: існують обмеження під час керування створеними зображеннями на веб-сайті Microsoft Bing.
  • Швидкість генерації: Процес створення Dall-E 3 може бути повільнішим порівняно з іншими моделями AI.

відмова

Відповідно до Правила проекту Trust, будь ласка, зверніть увагу, що інформація, надана на цій сторінці, не призначена і не повинна тлумачитися як юридична, податкова, інвестиційна, фінансова або будь-яка інша форма консультації. Важливо інвестувати лише те, що ви можете дозволити собі втратити, і звернутися за незалежною фінансовою порадою, якщо у вас виникнуть сумніви. Щоб отримати додаткову інформацію, ми пропонуємо звернутися до положень та умов, а також до сторінок довідки та підтримки, наданих емітентом або рекламодавцем. MetaversePost прагне до точного, неупередженого звітування, але ринкові умови можуть змінюватися без попередження.

про автора

Дамір є керівником групи, менеджером із продуктів і редактором Metaverse Post, що охоплює такі теми, як AI/ML, AGI, LLMs, Metaverse тощо Web3- суміжні поля. Його статті щомісяця приваблюють величезну аудиторію понад мільйон користувачів. Здається, він є експертом із 10-річним досвідом роботи в SEO та цифровому маркетингу. Даміра згадували в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto та інші видання. Він подорожує між ОАЕ, Туреччиною, Росією та СНД як цифровий кочівник. Дамір отримав ступінь бакалавра з фізики, що, на його думку, дало йому навички критичного мислення, необхідні для досягнення успіху в Інтернеті, який постійно змінюється. 

інші статті
Дамір Ялалов
Дамір Ялалов

Дамір є керівником групи, менеджером із продуктів і редактором Metaverse Post, що охоплює такі теми, як AI/ML, AGI, LLMs, Metaverse тощо Web3- суміжні поля. Його статті щомісяця приваблюють величезну аудиторію понад мільйон користувачів. Здається, він є експертом із 10-річним досвідом роботи в SEO та цифровому маркетингу. Даміра згадували в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto та інші видання. Він подорожує між ОАЕ, Туреччиною, Росією та СНД як цифровий кочівник. Дамір отримав ступінь бакалавра з фізики, що, на його думку, дало йому навички критичного мислення, необхідні для досягнення успіху в Інтернеті, який постійно змінюється. 

Hot Stories
Приєднуйтеся до нашої розсилки.
Останні новини

Від Ripple до The Big Green DAO: як криптовалютні проекти сприяють благодійності

Давайте розглянемо ініціативи, які використовують потенціал цифрових валют для благодійних цілей.

Дізнайтеся більше

AlphaFold 3, Med-Gemini та інші: як AI трансформує охорону здоров’я у 2024 році

ШІ проявляється різними способами в охороні здоров’я, від виявлення нових генетичних кореляцій до розширення можливостей роботизованих хірургічних систем...

Дізнайтеся більше
Приєднуйтесь до нашої спільноти інноваційних технологій
Детальніше
Читати далі
Biswap випускає нову стратегічну дорожню карту, зосереджену на розширенні кількох ланцюгів і впровадженні ліквідного стекінгу
ринки Звіт про новини Технологія
Biswap випускає нову стратегічну дорожню карту, зосереджену на розширенні кількох ланцюгів і впровадженні ліквідного стекінгу
Травень 24, 2024
Web3 Представлений AI: Джиммі Чжао розповідає, як BNB Chain інтегрує блокчейн і AI Redefines Довіра, прозорість і децентралізація
інтерв'ю Business ринки Софтвер Технологія
Web3 Представлений AI: Джиммі Чжао розповідає, як BNB Chain інтегрує блокчейн і AI Redefines Довіра, прозорість і децентралізація
Травень 24, 2024
Hyperliquid представляє функцію розгортання точкового токена HIP-1 у своїй мережі та рекомендує тестування для плавного розгортання
Звіт про новини Технологія
Hyperliquid представляє функцію розгортання точкового токена HIP-1 у своїй мережі та рекомендує тестування для плавного розгортання
Травень 24, 2024
Найпопулярніші пропозиції цього тижня, великі інвестиції в AI, IT, Web3і Crypto (20-24.05)
Digest Топ списки Business Стиль життя ринки Софтвер Технологія
Найпопулярніші пропозиції цього тижня, великі інвестиції в AI, IT, Web3і Crypto (20-24.05)
Травень 24, 2024
CRYPTOMERIA LABS PTE. LTD.