Dall-E 3 проти. Midjourney: Велике порівняння найдосконаліших арт-генераторів AI
Приєднуйтесь до нас у цій захоплюючій подорожі, коли ми досліджуємо Dall-E 3 і Midjourneyтонкощі, складності та невикористаний потенціал. Ця стаття висвітлює найбільш інтригуючі порівняння, засновані на дослідженні, проведеному ентузіастом ШІ Атачкіною; якщо вам цікаво дізнатися більше, натисніть link.
Про Поради |
---|
1. Розкрийте 50 найпопулярніших підказок для перетворення тексту в зображення для AI Art Generators Midjourney і DALL-E. |
2. Запаліть свою творчість за допомогою 20 найпопулярніших AI-генераторів тексту в зображення з 2023. |
Ця стаття містить підказку для перетворення тексту в зображення, зображення, що показує результати Dall-E 3 і Midjourney, а також пояснення відмінностей між ними генератори мистецтва. Давайте почнемо.
Обидві нейронні мережі показали чудові результати в цьому випадку з Midjourney трохи перевершує інших.
Тут Dall-E 3 впорався набагато гірше; вона отримала яскраві фарби фасонів, але не чіткість деталей; на задньому плані з'явилися деформовані тіла, а обличчя зовсім не вдалі.
Цікаво вийшло в обох місцях, але Dall-E 3 знову поборовся з обличчями. Натомість він зробив плюшевий бежевий мішок, як зазначено в підказці, і Midjourney нехтував цим. У цьому випадку Dall-E 3 дуже слухняно виконав підказку.
І знову, хоча обидві сітки створюють чудові колажі, Dall-E 3 точніше відповідає підказці; він додавав тільки вказаних нами героїв, не міг перетворитися на джокера, і схрестив капітана з Бетменом.
Midjourney зміг поєднати відповідні стилі двох художників із підказки, тоді як Dall-E 3 просто додав багато насичених деталей і яскравих кольорів на фоні.
Знову коти в найкращій формі, і обидві нейронні мережі чудово розуміють плівкові камери. Однак Dall-E 3 навіть додає знімкам зернистість.
Dall-E 3 створив молодого Леонардо Ді Капріо з крутими текстурами джемпера, додав зернистість плівки і колірну гамму і дуже круто відобразив відчуття російської дачі. Midjourney була хорошим відбивачем кольору для фільму, і Ді Капріо надав їй більш зрілого вигляду.
Хоча обидва нейронні мережі вправно створюють колажі, якщо придивитися, Midjourney спотворює обличчя і форми деяких предметів, а Dall-E 3 більш точний у виконанні самих персонажів — виявився навіть Чубакка.
Коли ви збільшите масштаб фотографій, ви помітите, що Dall-E 3 має розмиті очі; Midjourney, з іншого боку, бездоганний. Dall-E 3 також прописав бренд; змії на головах здаються більш живими і рухливими; Midjourney завжди робив їх лежачи, а не на голові.
Обидва класні, але Midjourney враховував стиль художника, а також ефект плівкової камери, тоді як Dall-E 3 проігнорував повний кадр і не врахував його.
Ми також вирішили протестувати фото з феями, але Dall-E 3 вперто відмовився від співпраці. Midjourney не проігнорував крила, оскільки було додано посилання з крилами. Коли Dall-E 3 зробив знімок, він запропонував кілька інтригуючих можливостей, але з американкою.
Midjourney зробили фантастичну роботу, але ми хочемо звернути особливу увагу на те, як Dall-E 3 створив ефекти плівки на верхньому правому зображенні та додав власний білий почерк; вийшло чудово.
Dall-E 3 зміг дуже слухняно втілити в одне зображення всіх героїв підказки. Midjourney дуже старався і навіть був близький до успіху.
На перший погляд здається, що обидва хороші, але при детальнішому розгляді виявляється, що Dall-E 3 не має фотореалістичного об’єму і що Midjourney з тріском обробляв стики вилами.
Обидва генератори є досвідченими у своїх галузях, причому Dall-E 3 перевершує текст і Midjourney відзначається фотореалізмом.
Фізика та геометрія фенів складні Midjourney. Можна витратити багато часу на спроби і посилання, іноді результати нагадують фен, але Dall-E 3 дав прийнятний результат з першої спроби і навіть написав текст.
Єдине око добре, але це вже інша історія. в Midjourney, ми написали негативну підказку – без мультфільму, ілюстрації, квартира, два ока. Dall-E 3 миттєво послухався й зробив одне око, посмішку та зняв капелюха, але категорично відмовився дозволити будь-кому сфотографувати її.
Midjourney зробили покоління не таким, як Бред, тому ми скористалися додатковим сервісом Insight Обмін обличчям показати обличчя Бреда поколінню; тут був пост про це. Dall-E 3 знає, хто такий Бред Пітт, і може малювати зірок без додаткового програмного забезпечення.
Обидві сітки хороші, але Dall-E 3 може створювати роги єдинорога Midjourney зазвичай не можна.
Dall-E 3 добре впорався із введенням персонажів у дію; ми можемо побачити орка та ельфа з ельфовими вухами. Також є людина в спортивному костюмі Nike, але очі в неї замазані. Ельфійські загострені вуха здебільшого ігноруються Midjourney, і Nike також не враховується.
Коли постскриптум «ілюстрація» спочатку був пропущений у підказці, Dall-E 3 створив її. Тоді ми вирішили порівняти це з Midjourney's ілюстрація. Поки Midjourney більше нагадував ілюстрації радянських часів і не містив крил феї, Dall-E 3 виконав фантастичну роботу, намалювавши серп і молот. Приклад праворуч показує, як Dall-E 3 може виглядати в тексті.
Тим не менш, Midjourney пішов у фотореалізм; на картинках немає головного героя, тільки оточення, але все одно круто. Dall-E 3 більше не хотів бути на фото.
Dall-E 3 проти. Midjourney: Плюси і мінуси
Коли користувачі досліджують цю технологію, з’ясовуються кілька помітних сильних сторін і обмежень, що дає змогу краще зрозуміти її функціональність.
Плюси:
- Швидка слухняність: Однією з видатних особливостей Dall-E 3 є його чудова здатність точно виконувати підказки. Користувачі повідомили, що модель ШІ ефективно реагує на широкий діапазон вхідних даних, що робить її універсальним інструментом для різних завдань.
- Багатогранна творчість: Dall-E 3 демонструє можливість відображати кілька персонажів на одному зображенні, розширюючи його потенціал для оповідання історій і творчих проектів. Цей багатогранний підхід підвищує його корисність у різних областях.
- Інтеграція тексту: Користувачі відзначили вміння Dall-E 3 легко інтегрувати текст у зображення. Ця функція полегшує створення візуально привабливого вмісту з вбудованими текстовими елементами.
Мінуси:
- Чіткість зображення: Помітним обмеженням є схильність ШІ створювати зображення з розмитими обличчями та очима. Незважаючи на те, що він вирізняється креативністю, йому іноді бракує ясності й точності, які можна побачити у створеному людьми вмісті.
- Послідовність стилю: Dall-E 3 не повторює послідовно стилі певних виконавців, що може бути недоліком для тих, хто шукає точного художнього наслідування.
- Вимоги до VPN: Доступ до Dall-E 3 наразі вимагає використання VPN, що може створити проблеми з доступністю для деяких користувачів.
- Керування зображеннями: Користувачі зіткнулися з обмеженнями під час керування згенерованими зображеннями на веб-сайті Microsoft Bing. Примітно, що немає функції орієнтації формату, а історія зображень обмежена останніми завантаженнями, що вимагає негайного копіювання для подальшого використання.
- Швидкість генерації: У деяких випадках повідомлялося, що процес генерації в Dall-E 3 відбувається повільніше порівняно з іншими моделями AI.
Незважаючи на ці обмеження, Dall-E 3 має значні перспективи. Користувачі та експерти визнають його потенціал для революції у створенні контенту та оповіді. як OpenAI продовжує вдосконалювати та розширювати свої пропозиції, очікується, що сильні сторони Dall-E 3 засяють ще яскравіше, що зробить його цінним інструментом у різних сферах.
Питання і відповіді
І Dall-E 3, і Midjourney мають свої сильні та слабкі сторони. Dall-E 3 особливо слухняний до підказок і може легко інтегрувати текст у зображення. Однак іноді він створює зображення з розмитими обличчями та очима та може неповторно відтворювати стилі певних художників. З іншого боку, Midjourney перевершує фотореалізм, але не завжди може передати суть певних підказок так точно, як Dall-E 3.
У статті наведено підказки для перетворення тексту в зображення, демонструючи результати як Dall-E 3, так і Midjourneyі пояснює відмінності між двома генераторами мистецтва.
Обидві моделі ШІ мають свої сильні та слабкі сторони. Наприклад, у підказці про космонавта на Юпітері, Midjourney трохи перевершив Dall-E 3. Однак в іншій підказці про Диво-Жінку Dall-E 3 був точнішим у вловленні суті підказки.
- Швидка слухняність: Dall-E 3 точно виконує підказки.
- Багатогранна творчість: може зображати кілька персонажів на одному зображенні.
- Текстова інтеграція: Dall-E 3 може легко інтегрувати текст у зображення.
- Чіткість зображення: іноді створює зображення з розмитими обличчями та очима.
- Послідовність стилю: Dall-E 3 не послідовно повторює стилі певних виконавців.
- Управління іміджем: існують обмеження під час керування створеними зображеннями на веб-сайті Microsoft Bing.
- Швидкість генерації: Процес створення Dall-E 3 може бути повільнішим порівняно з іншими моделями AI.
відмова
Відповідно до Правила проекту Trust, будь ласка, зверніть увагу, що інформація, надана на цій сторінці, не призначена і не повинна тлумачитися як юридична, податкова, інвестиційна, фінансова або будь-яка інша форма консультації. Важливо інвестувати лише те, що ви можете дозволити собі втратити, і звернутися за незалежною фінансовою порадою, якщо у вас виникнуть сумніви. Щоб отримати додаткову інформацію, ми пропонуємо звернутися до положень та умов, а також до сторінок довідки та підтримки, наданих емітентом або рекламодавцем. MetaversePost прагне до точного, неупередженого звітування, але ринкові умови можуть змінюватися без попередження.
про автора
Дамір є керівником групи, менеджером із продуктів і редактором Metaverse Post, що охоплює такі теми, як AI/ML, AGI, LLMs, Metaverse тощо Web3- суміжні поля. Його статті щомісяця приваблюють величезну аудиторію понад мільйон користувачів. Здається, він є експертом із 10-річним досвідом роботи в SEO та цифровому маркетингу. Даміра згадували в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto та інші видання. Він подорожує між ОАЕ, Туреччиною, Росією та СНД як цифровий кочівник. Дамір отримав ступінь бакалавра з фізики, що, на його думку, дало йому навички критичного мислення, необхідні для досягнення успіху в Інтернеті, який постійно змінюється.
інші статтіДамір є керівником групи, менеджером із продуктів і редактором Metaverse Post, що охоплює такі теми, як AI/ML, AGI, LLMs, Metaverse тощо Web3- суміжні поля. Його статті щомісяця приваблюють величезну аудиторію понад мільйон користувачів. Здається, він є експертом із 10-річним досвідом роботи в SEO та цифровому маркетингу. Даміра згадували в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto та інші видання. Він подорожує між ОАЕ, Туреччиною, Росією та СНД як цифровий кочівник. Дамір отримав ступінь бакалавра з фізики, що, на його думку, дало йому навички критичного мислення, необхідні для досягнення успіху в Інтернеті, який постійно змінюється.