AI Wiki Искусство Технологии
02 октября 2023

Далл-Э 3 против. Midjourney: Большое сравнение самых продвинутых искусственных генераторов искусств

Присоединяйтесь к нам в этом захватывающем путешествии по исследованию Dall-E 3 и Midjourneyтонкости, сложности и неиспользованный потенциал. В этой статье представлены наиболее интригующие сравнения, основанные на исследованиях энтузиаста искусственного интеллекта Атачкиной; если вы хотите узнать больше, нажмите кнопку ссылке..

Далл-Э 3 против. Midjourney: Большое сравнение самых продвинутых искусственных генераторов искусств
Советы профессионалов
1. Раскройте 50 лучших подсказок для преобразования текста в изображение для генераторов искусств искусственного интеллекта Midjourney и ДАЛЛ-Э.
2. Разожгите свой творческий потенциал с помощью 20 лучших генераторов искусственных изображений для преобразования текста в изображения с помощью искусственного интеллекта из 2023.

В этой статье представлена ​​подсказка для преобразования текста в изображение, изображение, показывающее результаты Dall-E 3 и Midjourneyи объяснение различий между этими двумя генераторы искусства, Давай начнем.

Далл-Э 3 против. Midjourney: Большое сравнение самых продвинутых искусственных генераторов искусств
подсказка: Космонавт стоит на Юпитере и наблюдает восход солнца. футуристический интерфейс, вид от первого лица, космический командир, счетчик дождя и пользовательский интерфейс HUD Rise.

Обе нейронные сети в этом случае показали себя превосходно. Midjourney немного опережая остальных.

Далл-Э 3 против. Midjourney: Большое сравнение самых продвинутых искусственных генераторов искусств
подсказка: снято Слимом Ааронсом из «Чудо-женщины» в комнате, сложные слои и текстуры, детальный дизайн персонажей, фон с яркими, причудливыми и красочными сценами, пастельная цветокоррекция, как в фильмах Уэса Андерсона, зернистость пленки и Tokina AT-X 11-16mm f. /2.8 про dx II

Dall-E 3 здесь справился гораздо хуже; ему достались яркие краски фасонов, но не четкость деталей; на заднем плане появились деформированные тела, а лица совсем не удачны.

Далл-Э 3 против. Midjourney: Большое сравнение самых продвинутых искусственных генераторов искусств
подсказка: фотография милого пухлого киберкота в его онлайн-резиденции
Далл-Э 3 против. Midjourney: Большое сравнение самых продвинутых искусственных генераторов искусств
подсказка: профессиональная коммерческая студийная фотосъёмка для Nike; модель с длинными волосами; выстрел в полный рост; в бежевой футболке Nike; необычная джинсовая куртка Nike; мягкая бежевая плюшевая сумка Nike; мягкие фиолетовые кроссовки Nike; стою на светлом розово-голубом фоне; футуристический фон сложной обтекаемой формы с подсветкой; снято на Hasselblad X1D;

Оба места оказались интересными, но у Dall-E 3 снова возникли проблемы с лицами. Вместо этого он сделал плюшевую бежевую сумку, как указано в подсказке, и Midjourney проигнорировал это. В данном случае Далл-Э 3 очень послушно выполнил подсказку.

Далл-Э 3 против. Midjourney: Большое сравнение самых продвинутых искусственных генераторов искусств
подсказка: пузырчатая фигура с трассировкой лучей в пастельных тонах, женская скульптура с металлической отделкой, блестящая/глянцевая, яркая турбулентность, голубиная сердцевина, нетрадиционные позы, анаморфное искусство, переливчатость/опалесценция, петли обратной связи с видео, блестящие глаза, смелые изгибы, блестящий, плавный фигуратизм
Далл-Э 3 против. Midjourney: Большое сравнение самых продвинутых искусственных генераторов искусств
подсказка: винтажный ретро-коллаж с изображением супергероев, в том числе Чудо-женщины, Капитана Америки, Бэтмена и Джокера.

И еще раз: хотя из обеих сеток получаются отличные коллажи, Dall-E 3 более верен этой подсказке; он добавлял только указанных нами героев, не мог превратиться в джокера и скрещивал капитана с Бэтменом.

Далл-Э 3 против. Midjourney: Большое сравнение самых продвинутых искусственных генераторов искусств
Подсказка: металлическая капля с трассировкой лучей, анаморфотное искусство, привлекательные детали, точные линии, смелые кривые, блестящий, плавный фигуратизм, пастельные тона, темный фон.
Далл-Э 3 против. Midjourney: Большое сравнение самых продвинутых искусственных генераторов искусств
Подсказка: простые слои и текстуры, замысловатый дизайн персонажей, яркие, причудливые и красочные фоны, коррекция пастельных цветов в стиле фильмов Уэса Андерсона, зернистость пленки и объектив Tokina at-x 11-16mm f/2.8 pro dx II — все это присутствует. на этом снимке Человека-паука, отдыхающего на диване, сделанном Слимом Ааронсом.

Midjourney смог объединить стили двух художников с самого начала, тогда как Dall-E 3 просто добавил к фону множество ярких деталей и ярких цветов.

Далл-Э 3 против. Midjourney: Большое сравнение самых продвинутых искусственных генераторов искусств
Подсказка: фотография 80-х годов, на которой пухлые милые толстые коты, занимающиеся аэробикой в ​​забавных леопардовых леггинсах и розовых боди, была сделана на Kodak Gold 200.

И снова кошки в отличной форме, и обе нейронные сети прекрасно понимают пленочные камеры. Однако Dall-E 3 даже добавляет зернистости снимкам.

Далл-Э 3 против. Midjourney: Большое сравнение самых продвинутых искусственных генераторов искусств
1990-е годы: Леонардо Ди Каприо играет мастера-джедая на русской даче, вооруженного световым мечом и одетого в вязаный зеленый свитер.

Dall-E 3 создал молодого Леонардо Ди Каприо с крутыми текстурами свитера, добавил зернистость пленки и цветовую гамму и очень круто передал атмосферу русской дачи. Midjourney была хорошим отражателем цвета для фильма, а Ди Каприо придал ей более зрелый вид.

Далл-Э 3 против. Midjourney: Большое сравнение самых продвинутых искусственных генераторов искусств
подсказка: коллаж Star Wars изображения в винтажном стиле ретро

Хотя оба нейронные сети умеют создавать коллажи, если присмотреться, Midjourney искажает лица и формы некоторых предметов, а Dall-E 3 точнее в исполнении самих персонажей — им даже оказался Чубакка.

Далл-Э 3 против. Midjourney: Большое сравнение самых продвинутых искусственных генераторов искусств
подсказка: фотография русской медузы-горгоны в уличной одежде Balenciaga hypebeast, прогуливающейся по улице Манхэттена со змеями вместо волос.

Когда вы увеличите фотографии, вы заметите, что у Dall-E 3 размытые глаза; Midjourneyс другой стороны, безупречен. Dall-E 3 также прописал бренд; змеи на головах кажутся более живыми и подвижными; Midjourney всегда заставляла их лежать, а не на голове.

Далл-Э 3 против. Midjourney: Большое сравнение самых продвинутых искусственных генераторов искусств
Подсказка: на этой отмеченной наградами фотографии Слима Аарона изображен человек-паук, замаскированный под фею, в розовом пышном платье и с волшебной палочкой в ​​руках. Снимок был сделан камерой Fuji Superia X-TRA 800.

Оба круты, но Midjourney учитывался стиль художника, а также эффект пленочной камеры, тогда как Dall-E 3 проигнорировал полнометражный кадр и не учёл его.

Далл-Э 3 против. Midjourney: Большое сравнение самых продвинутых искусственных генераторов искусств
подсказка: фея СССР с крыльями и костюмом космонавта

Мы также приняли решение протестировать фото с феями, но Dall-E 3 упорно отказывался сотрудничать. Midjourney не проигнорировал крылья, потому что была добавлена ​​ссылка с крыльями. Когда Dall-E 3 сделал снимок, он предложил некоторые интригующие возможности, но с американкой.

Далл-Э 3 против. Midjourney: Большое сравнение самых продвинутых искусственных генераторов искусств
подсказка: улитка, позирующая для портрета в современной хипстерской одежде, сложные слои и текстуры 4K, детальный дизайн персонажей и зернистость пленки. Фон представляет собой яркие, причудливые и красочные сцены.

Midjourney проделали фантастическую работу, но мы хотим обратить особое внимание на то, как Dall-E 3 создал эффекты фильма в правом верхнем углу изображения и добавил собственный белый почерк; получилось великолепно.

Далл-Э 3 против. Midjourney: Большое сравнение самых продвинутых искусственных генераторов искусств
подсказка: Человек-Паук, Бэтмен и Железный Человек собрались выпить пива в баре.

Dall-E 3 смог очень послушно воплотить всех героев заставки в одном изображении еще раз. Midjourney очень старался и даже был близок к успеху.

Далл-Э 3 против. Midjourney: Большое сравнение самых продвинутых искусственных генераторов искусств
Подсказка: Летний салат из помидоров и огурцов, макро, полная сцена, теплые тона, фотореалистичный гиперреалист высокого качества, естественное освещение, Unreal 5 двигателя, цветокоррекция, редакционная фотография, фотография, фотосессия, Высокий, эпический, артгерм, снимок с объективом 70 мм, Глубина резкости, ГРИП, Размытие при наклоне, Выдержка 1/1000, F/22, Баланс белого, 32k, Супер-разрешение

На первый взгляд кажется, что оба хороши, но при ближайшем рассмотрении выясняется, что Dall-E 3 не хватает фотореалистичного объема и что Midjourney С суставами вилками обращался на ура.

Далл-Э 3 против. Midjourney: Большое сравнение самых продвинутых искусственных генераторов искусств
подсказка: Макдональдс в стиле воображаемых космических пейзажей с реалистичными человеческими фигурами, двумя машинами и трактором, над которым находится луна. Les Nasbis, Пьер Пеллегрини, научный подход, новаторская смелая насыщенность, файеркор

Оба генератора являются опытными в своих областях, причем Dall-E 3 превосходно работает с текстом и Midjourney преуспевает в фотореализме.

Далл-Э 3 против. Midjourney: Большое сравнение самых продвинутых искусственных генераторов искусств
Фен BaByliss D570DE используется в современном интерьере с вечерним освещением, индустриальным дизайном и пастельными тонами, идеально подходит для студийной съемки.

Физика и геометрия фенов сложны для понимания. Midjourney. Можно потратить много времени на борьбу с попытками и референсами, иногда результаты напоминают работу фена, но Dall-E 3 с первой попытки выдал приемлемый результат и даже написал текст.

Далл-Э 3 против. Midjourney: Большое сравнение самых продвинутых искусственных генераторов искусств
подсказка: фото одноглазой Туранги Лилы из Футурамы

Единственный глаз хороший, но это уже другая история. В Midjourney, мы написали негативную подсказку – никакого шаржа, иллюстрация, плоская, два глаза. Далл-Э 3 немедленно повиновалась и сняла один глаз, улыбку и шляпу, но наотрез отказалась позволить кому-либо ее сфотографировать.

Далл-Э 3 против. Midjourney: Большое сравнение самых продвинутых искусственных генераторов искусств
Актер Брэд Питт в 1990-х годах поливает грядки на русской даче в полосатой майке и спортивных штанах Adidas. Сцена была снята на Agfa Vista 400.

Midjourney сделали поколение не похожее на Брэда, поэтому воспользовались дополнительным сервисом Insight Лицо Обмен показать поколению лицо Брэда; здесь был пост об этом. Dall-E 3 знает, кто такой Брэд Питт, и может рисовать звезды без какого-либо дополнительного программного обеспечения.

Далл-Э 3 против. Midjourney: Большое сравнение самых продвинутых искусственных генераторов искусств
подсказка: красивая девушка, единороги, яблочные технологии и винтажный ретро-коллаж из галактик.

Обе сетки хороши, но Dall-E 3 может создавать рога единорога, пока Midjourney обычно не может.

Далл-Э 3 против. Midjourney: Большое сравнение самых продвинутых искусственных генераторов искусств
подсказка: мороженое в руке, спортивная одежда Nike и потрясающий фэнтезийный эльф, сидящий рядом с орком на уличной фотографии.

Dall-E 3 хорошо поработал над персонажами; мы видим орка и эльфа с эльфийскими ушами. Еще есть человек в спортивном костюме Nike, но глаза у него замазаны. Эльфийские заостренные уши в основном игнорируются Midjourney, и Nike тоже не учитывается.

Далл-Э 3 против. Midjourney: Большое сравнение самых продвинутых искусственных генераторов искусств
подсказка: рисунок феи СССР в костюме космонавта

Когда постскриптум «иллюстрация» изначально был исключен из подсказки, Dall-E 3 создал его. Затем мы решили сравнить его с Midjourneyиллюстрация. Пока Midjourney больше напоминал иллюстрации советской эпохи и не включал волшебные крылья, Dall-E 3 проделал фантастическую работу по рисованию серпа и молота. Пример справа показывает, как Dall-E 3 может выглядеть в тексте.

Далл-Э 3 против. Midjourney: Большое сравнение самых продвинутых искусственных генераторов искусств
подсказка: дача на Юпитере, вдалеке виднеются орбитальные кольца планеты, инопланетянин готовит шашлык, замысловатый дизайн персонажей, яркий, причудливый и красочный фон, пастельная цветокоррекция в стиле фильмов Уэса Андерсона, пленочное зерно и Tokina AT -Объектив X 11–16 мм f/2.8 Pro dX II

Однако Midjourney ушёл в фотореализм; на изображениях нет главного героя, только антураж, но все равно круто. Dall-E 3 не хотел снова появляться на фотографии.

Далл-Э 3 против. Midjourney: Большое сравнение самых продвинутых искусственных генераторов искусств
подсказка: зернистость пленки, корм для собак, замысловатый дизайн персонажей, слои и текстуры, яркие, дурацкие и красочные сцены на заднем плане и пастельная цветокоррекция, как в фильме Уэса Андерсона.

Далл-Э 3 против. Midjourney: Плюсы и минусы

По мере изучения этой технологии пользователями выявляются некоторые ее сильные и слабые стороны, что позволяет лучше понять ее функциональность.

Плюсы:

  1. Быстрое послушание: Одной из выдающихся особенностей Dall-E 3 является его замечательная способность точно следовать подсказкам. Пользователи сообщают, что модель искусственного интеллекта эффективно реагирует на широкий спектр входных данных, что делает ее универсальным инструментом для различных задач.
  2. Многогранное творчество: Dall-E 3 демонстрирует возможность изображать несколько персонажей на одном изображении, что расширяет его возможности для повествования и творческих проектов. Этот многогранный подход повышает его полезность в различных областях.
  3. Текстовая интеграция: Пользователи отметили способность Dall-E 3 плавно интегрировать текст в изображения. Эта функция облегчает создание визуально привлекательного контента со встроенными текстовыми элементами.

Минусы:

  1. Четкость изображения: Заметным ограничением является склонность ИИ создавать изображения с размытыми лицами и глазами. Несмотря на то, что он отличается креативностью, ему иногда не хватает ясности и точности, присущих контенту, созданному человеком.
  2. Согласованность стиля: Dall-E 3 не всегда повторяет стили конкретных исполнителей., что может быть недостатком для тех, кто ищет точную художественную имитацию.
  3. Требование VPN: Доступ к Dall-E 3 в настоящее время требует использования VPN, что может создать проблемы с доступом для некоторых пользователей.
  4. Управление изображениями: Пользователи столкнулись с ограничениями при управлении сгенерированными изображениями на веб-сайте Microsoft Bing. Примечательно, что здесь нет функции ориентации по формату, а история изображений ограничивается недавними загрузками, что требует немедленного копирования для последующего использования.
  5. Скорость генерации: Сообщается, что в некоторых случаях процесс генерации в Dall-E 3 происходит медленнее по сравнению с другими моделями ИИ.

Несмотря на эти ограничения, Dall-E 3 подает большие надежды. Как пользователи, так и эксперты признают его потенциал совершить революцию в создании контента и рассказывании историй. Как OpenAI продолжает совершенствовать и расширять свои предложения, ожидается, что сильные стороны Dall-E 3 проявятся еще ярче, что сделает его ценным инструментом в различных областях.

Часто задаваемые вопросы

И Dall-E 3, и Midjourney имеют свои сильные и слабые стороны. Dall-E 3 особенно послушен подсказкам и может легко интегрировать текст в изображения. Однако иногда он создает изображения с размытыми лицами и глазами и не может последовательно воспроизводить стили конкретных художников. С другой стороны, Midjourney превосходен в фотореалистичности, но не всегда может так точно передать суть некоторых подсказок, как Dall-E 3.

В статье представлены текстовые подсказки с изображением, демонстрирующие результаты как Dall-E 3, так и Midjourneyи объясняет различия между двумя генераторами изображений.

Обе модели ИИ имеют свои сильные и слабые стороны. Например, в подсказке о космонавте на Юпитере: Midjourney немного обогнал Dall-E 3. Однако в другой подсказке о Чудо-женщине Dall-E 3 точнее передал суть подсказки.

  • Быстрое послушание: Dall-E 3 точно следует подсказкам.
  • Многогранное творчество: на одном изображении может быть изображено несколько символов.
  • Текстовая интеграция: Dall-E 3 может легко интегрировать текст в изображения.
  • Четкость изображения: иногда изображения получаются с размытыми лицами и глазами.
  • Последовательность стиля: Dall-E 3 не всегда повторяет стили конкретных исполнителей.
  • Управление изображениями: существуют ограничения при управлении созданными изображениями на веб-сайте Microsoft Bing.
  • Скорость генерации: Процесс генерации Dall-E 3 может быть медленнее по сравнению с другими моделями искусственного интеллекта.

Условия использования

В соответствии с Руководство трастового проектаОбратите внимание, что информация, представленная на этой странице, не предназначена и не должна интерпретироваться как юридическая, налоговая, инвестиционная, финансовая или любая другая форма консультации. Важно инвестировать только то, что вы можете позволить себе потерять, и обращаться за независимой финансовой консультацией, если у вас есть какие-либо сомнения. Для получения дополнительной информации мы предлагаем обратиться к положениям и условиям, а также к страницам справки и поддержки, предоставленным эмитентом или рекламодателем. MetaversePost стремится предоставлять точную и объективную отчетность, однако рыночные условия могут быть изменены без предварительного уведомления.

Об авторе

Дамир — руководитель группы, менеджер по продукту и редактор в Metaverse Post, охватывающие такие темы, как AI/ML, AGI, LLM, Metaverse и Web3-связанные поля. Его статьи ежемесячно привлекают огромную аудиторию, насчитывающую более миллиона пользователей. Похоже, он эксперт с 10-летним опытом работы в области SEO и цифрового маркетинга. Дамир упоминается в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и другие издания. Он путешествует между ОАЭ, Турцией, Россией и СНГ в качестве цифрового кочевника. Дамир получил степень бакалавра в области физики, что, по его мнению, дало ему навыки критического мышления, необходимые для достижения успеха в постоянно меняющемся мире Интернета. 

Другие статьи
Дамир Ялалов
Дамир Ялалов

Дамир — руководитель группы, менеджер по продукту и редактор в Metaverse Post, охватывающие такие темы, как AI/ML, AGI, LLM, Metaverse и Web3-связанные поля. Его статьи ежемесячно привлекают огромную аудиторию, насчитывающую более миллиона пользователей. Похоже, он эксперт с 10-летним опытом работы в области SEO и цифрового маркетинга. Дамир упоминается в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и другие издания. Он путешествует между ОАЭ, Турцией, Россией и СНГ в качестве цифрового кочевника. Дамир получил степень бакалавра в области физики, что, по его мнению, дало ему навыки критического мышления, необходимые для достижения успеха в постоянно меняющемся мире Интернета. 

Hot Stories
Подпишитесь на нашу рассылку.
Новости

От Ripple до The Big Green DAO: как криптовалютные проекты способствуют благотворительности

Давайте рассмотрим инициативы по использованию потенциала цифровых валют в благотворительных целях.

Узнать больше

AlphaFold 3, Med-Gemini и другие: как искусственный интеллект трансформирует здравоохранение в 2024 году

ИИ проявляется в здравоохранении по-разному: от открытия новых генетических корреляций до расширения возможностей роботизированных хирургических систем...

Узнать больше
Узнать больше
Читать далее
Kamino Finance запускает новый рынок Jito в Kamino Lend для ускорения роста JitoSOL
Новостной репортаж Технологии
Kamino Finance запускает новый рынок Jito в Kamino Lend для ускорения роста JitoSOL
5 ноября 2024
Arcium приобретает основные технологии и команду у Inpher для повышения производительности и возможностей сети
Бизнес Новостной репортаж Технологии
Arcium приобретает основные технологии и команду у Inpher для повышения производительности и возможностей сети
4 ноября 2024
Gemini начинает кампанию «Туда, куда не пойдут доллары», давая представление о том, как криптовалюта будет влиять на нашу жизнь среди звезд
Бизнес Новостной репортаж Технологии
Gemini начинает кампанию «Туда, куда не пойдут доллары», давая представление о том, как криптовалюта будет влиять на нашу жизнь среди звезд
4 ноября 2024
AuditHub от Veridise: запуск платформы для прозрачных и интеллектуальных аудитов безопасности
Обзор Бизнес Software Технологии
AuditHub от Veridise: запуск платформы для прозрачных и интеллектуальных аудитов безопасности
4 ноября 2024
CRYPTOMERIA LABS PTE. ООО