Далл-Э 3 против. Midjourney: Большое сравнение самых продвинутых искусственных генераторов искусств
Присоединяйтесь к нам в этом захватывающем путешествии по исследованию Dall-E 3 и Midjourneyтонкости, сложности и неиспользованный потенциал. В этой статье представлены наиболее интригующие сравнения, основанные на исследованиях энтузиаста искусственного интеллекта Атачкиной; если вы хотите узнать больше, нажмите кнопку ссылке..
Советы профессионалов |
---|
1. Раскройте 50 лучших подсказок для преобразования текста в изображение для генераторов искусств искусственного интеллекта Midjourney и ДАЛЛ-Э. |
2. Разожгите свой творческий потенциал с помощью 20 лучших генераторов искусственных изображений для преобразования текста в изображения с помощью искусственного интеллекта из 2023. |
В этой статье представлена подсказка для преобразования текста в изображение, изображение, показывающее результаты Dall-E 3 и Midjourneyи объяснение различий между этими двумя генераторы искусства, Давай начнем.
Обе нейронные сети в этом случае показали себя превосходно. Midjourney немного опережая остальных.
Dall-E 3 здесь справился гораздо хуже; ему достались яркие краски фасонов, но не четкость деталей; на заднем плане появились деформированные тела, а лица совсем не удачны.
Оба места оказались интересными, но у Dall-E 3 снова возникли проблемы с лицами. Вместо этого он сделал плюшевую бежевую сумку, как указано в подсказке, и Midjourney проигнорировал это. В данном случае Далл-Э 3 очень послушно выполнил подсказку.
И еще раз: хотя из обеих сеток получаются отличные коллажи, Dall-E 3 более верен этой подсказке; он добавлял только указанных нами героев, не мог превратиться в джокера и скрещивал капитана с Бэтменом.
Midjourney смог объединить стили двух художников с самого начала, тогда как Dall-E 3 просто добавил к фону множество ярких деталей и ярких цветов.
И снова кошки в отличной форме, и обе нейронные сети прекрасно понимают пленочные камеры. Однако Dall-E 3 даже добавляет зернистости снимкам.
Dall-E 3 создал молодого Леонардо Ди Каприо с крутыми текстурами свитера, добавил зернистость пленки и цветовую гамму и очень круто передал атмосферу русской дачи. Midjourney была хорошим отражателем цвета для фильма, а Ди Каприо придал ей более зрелый вид.
Хотя оба нейронные сети умеют создавать коллажи, если присмотреться, Midjourney искажает лица и формы некоторых предметов, а Dall-E 3 точнее в исполнении самих персонажей — им даже оказался Чубакка.
Когда вы увеличите фотографии, вы заметите, что у Dall-E 3 размытые глаза; Midjourneyс другой стороны, безупречен. Dall-E 3 также прописал бренд; змеи на головах кажутся более живыми и подвижными; Midjourney всегда заставляла их лежать, а не на голове.
Оба круты, но Midjourney учитывался стиль художника, а также эффект пленочной камеры, тогда как Dall-E 3 проигнорировал полнометражный кадр и не учёл его.
Мы также приняли решение протестировать фото с феями, но Dall-E 3 упорно отказывался сотрудничать. Midjourney не проигнорировал крылья, потому что была добавлена ссылка с крыльями. Когда Dall-E 3 сделал снимок, он предложил некоторые интригующие возможности, но с американкой.
Midjourney проделали фантастическую работу, но мы хотим обратить особое внимание на то, как Dall-E 3 создал эффекты фильма в правом верхнем углу изображения и добавил собственный белый почерк; получилось великолепно.
Dall-E 3 смог очень послушно воплотить всех героев заставки в одном изображении еще раз. Midjourney очень старался и даже был близок к успеху.
На первый взгляд кажется, что оба хороши, но при ближайшем рассмотрении выясняется, что Dall-E 3 не хватает фотореалистичного объема и что Midjourney С суставами вилками обращался на ура.
Оба генератора являются опытными в своих областях, причем Dall-E 3 превосходно работает с текстом и Midjourney преуспевает в фотореализме.
Физика и геометрия фенов сложны для понимания. Midjourney. Можно потратить много времени на борьбу с попытками и референсами, иногда результаты напоминают работу фена, но Dall-E 3 с первой попытки выдал приемлемый результат и даже написал текст.
Единственный глаз хороший, но это уже другая история. В Midjourney, мы написали негативную подсказку – никакого шаржа, иллюстрация, плоская, два глаза. Далл-Э 3 немедленно повиновалась и сняла один глаз, улыбку и шляпу, но наотрез отказалась позволить кому-либо ее сфотографировать.
Midjourney сделали поколение не похожее на Брэда, поэтому воспользовались дополнительным сервисом Insight Лицо Обмен показать поколению лицо Брэда; здесь был пост об этом. Dall-E 3 знает, кто такой Брэд Питт, и может рисовать звезды без какого-либо дополнительного программного обеспечения.
Обе сетки хороши, но Dall-E 3 может создавать рога единорога, пока Midjourney обычно не может.
Dall-E 3 хорошо поработал над персонажами; мы видим орка и эльфа с эльфийскими ушами. Еще есть человек в спортивном костюме Nike, но глаза у него замазаны. Эльфийские заостренные уши в основном игнорируются Midjourney, и Nike тоже не учитывается.
Когда постскриптум «иллюстрация» изначально был исключен из подсказки, Dall-E 3 создал его. Затем мы решили сравнить его с Midjourneyиллюстрация. Пока Midjourney больше напоминал иллюстрации советской эпохи и не включал волшебные крылья, Dall-E 3 проделал фантастическую работу по рисованию серпа и молота. Пример справа показывает, как Dall-E 3 может выглядеть в тексте.
Однако Midjourney ушёл в фотореализм; на изображениях нет главного героя, только антураж, но все равно круто. Dall-E 3 не хотел снова появляться на фотографии.
Далл-Э 3 против. Midjourney: Плюсы и минусы
По мере изучения этой технологии пользователями выявляются некоторые ее сильные и слабые стороны, что позволяет лучше понять ее функциональность.
Плюсы:
- Быстрое послушание: Одной из выдающихся особенностей Dall-E 3 является его замечательная способность точно следовать подсказкам. Пользователи сообщают, что модель искусственного интеллекта эффективно реагирует на широкий спектр входных данных, что делает ее универсальным инструментом для различных задач.
- Многогранное творчество: Dall-E 3 демонстрирует возможность изображать несколько персонажей на одном изображении, что расширяет его возможности для повествования и творческих проектов. Этот многогранный подход повышает его полезность в различных областях.
- Текстовая интеграция: Пользователи отметили способность Dall-E 3 плавно интегрировать текст в изображения. Эта функция облегчает создание визуально привлекательного контента со встроенными текстовыми элементами.
Минусы:
- Четкость изображения: Заметным ограничением является склонность ИИ создавать изображения с размытыми лицами и глазами. Несмотря на то, что он отличается креативностью, ему иногда не хватает ясности и точности, присущих контенту, созданному человеком.
- Согласованность стиля: Dall-E 3 не всегда повторяет стили конкретных исполнителей., что может быть недостатком для тех, кто ищет точную художественную имитацию.
- Требование VPN: Доступ к Dall-E 3 в настоящее время требует использования VPN, что может создать проблемы с доступом для некоторых пользователей.
- Управление изображениями: Пользователи столкнулись с ограничениями при управлении сгенерированными изображениями на веб-сайте Microsoft Bing. Примечательно, что здесь нет функции ориентации по формату, а история изображений ограничивается недавними загрузками, что требует немедленного копирования для последующего использования.
- Скорость генерации: Сообщается, что в некоторых случаях процесс генерации в Dall-E 3 происходит медленнее по сравнению с другими моделями ИИ.
Несмотря на эти ограничения, Dall-E 3 подает большие надежды. Как пользователи, так и эксперты признают его потенциал совершить революцию в создании контента и рассказывании историй. Как OpenAI продолжает совершенствовать и расширять свои предложения, ожидается, что сильные стороны Dall-E 3 проявятся еще ярче, что сделает его ценным инструментом в различных областях.
Часто задаваемые вопросы
И Dall-E 3, и Midjourney имеют свои сильные и слабые стороны. Dall-E 3 особенно послушен подсказкам и может легко интегрировать текст в изображения. Однако иногда он создает изображения с размытыми лицами и глазами и не может последовательно воспроизводить стили конкретных художников. С другой стороны, Midjourney превосходен в фотореалистичности, но не всегда может так точно передать суть некоторых подсказок, как Dall-E 3.
В статье представлены текстовые подсказки с изображением, демонстрирующие результаты как Dall-E 3, так и Midjourneyи объясняет различия между двумя генераторами изображений.
Обе модели ИИ имеют свои сильные и слабые стороны. Например, в подсказке о космонавте на Юпитере: Midjourney немного обогнал Dall-E 3. Однако в другой подсказке о Чудо-женщине Dall-E 3 точнее передал суть подсказки.
- Быстрое послушание: Dall-E 3 точно следует подсказкам.
- Многогранное творчество: на одном изображении может быть изображено несколько символов.
- Текстовая интеграция: Dall-E 3 может легко интегрировать текст в изображения.
- Четкость изображения: иногда изображения получаются с размытыми лицами и глазами.
- Последовательность стиля: Dall-E 3 не всегда повторяет стили конкретных исполнителей.
- Управление изображениями: существуют ограничения при управлении созданными изображениями на веб-сайте Microsoft Bing.
- Скорость генерации: Процесс генерации Dall-E 3 может быть медленнее по сравнению с другими моделями искусственного интеллекта.
Условия использования
В соответствии с Руководство трастового проектаОбратите внимание, что информация, представленная на этой странице, не предназначена и не должна интерпретироваться как юридическая, налоговая, инвестиционная, финансовая или любая другая форма консультации. Важно инвестировать только то, что вы можете позволить себе потерять, и обращаться за независимой финансовой консультацией, если у вас есть какие-либо сомнения. Для получения дополнительной информации мы предлагаем обратиться к положениям и условиям, а также к страницам справки и поддержки, предоставленным эмитентом или рекламодателем. MetaversePost стремится предоставлять точную и объективную отчетность, однако рыночные условия могут быть изменены без предварительного уведомления.
Об авторе
Дамир — руководитель группы, менеджер по продукту и редактор в Metaverse Post, охватывающие такие темы, как AI/ML, AGI, LLM, Metaverse и Web3-связанные поля. Его статьи ежемесячно привлекают огромную аудиторию, насчитывающую более миллиона пользователей. Похоже, он эксперт с 10-летним опытом работы в области SEO и цифрового маркетинга. Дамир упоминается в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и другие издания. Он путешествует между ОАЭ, Турцией, Россией и СНГ в качестве цифрового кочевника. Дамир получил степень бакалавра в области физики, что, по его мнению, дало ему навыки критического мышления, необходимые для достижения успеха в постоянно меняющемся мире Интернета.
Другие статьиДамир — руководитель группы, менеджер по продукту и редактор в Metaverse Post, охватывающие такие темы, как AI/ML, AGI, LLM, Metaverse и Web3-связанные поля. Его статьи ежемесячно привлекают огромную аудиторию, насчитывающую более миллиона пользователей. Похоже, он эксперт с 10-летним опытом работы в области SEO и цифрового маркетинга. Дамир упоминается в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и другие издания. Он путешествует между ОАЭ, Турцией, Россией и СНГ в качестве цифрового кочевника. Дамир получил степень бакалавра в области физики, что, по его мнению, дало ему навыки критического мышления, необходимые для достижения успеха в постоянно меняющемся мире Интернета.