Релиз DALL-E 3 усиливается OpenAIВлияние, уход Midjourney и Stable Diffusion За
Коротко
DALL-E 3 легко интегрируется с GPT-4, специально разработанный для ChatGPT+ подписчики.
DALL-E 3 воздерживается от воссоздания изображений общественных деятелей, когда их имена явно упоминаются.
Срок доступа к DALL-E 3 назначен на октябрь.
OpenAI представила свое последнее творение: ДАЛЛ-Э 3. В отличие от своих предшественников, DALL-E 3 фокусируется на уточнении деталей, решении таких проблем, как надписи и сложные детали тела, такие как пальцы. Результат? Массив эстетически привлекательных изображений без необходимости использования сложных подсказок или обходных путей.
Важно отметить, что этот выпуск не содержит полного набора подробностей реализации, статей или API. Вместо этого DALL-E 3 настроен на полную интеграцию с GPT-4, специально разработанный для ChatGPT+ подписчики.
Это развитие может быть не сейсмическим сдвигом в сфере искусственного интеллекта, а, скорее, шагом вперед в сотрудничестве между моделями. Многие ожидают, что следующий Stable Diffusion модель предложит еще большую изысканность и художественную привлекательность.
Чтобы поместить это в контекст, OpenAIПуть компании к созданию изображений с помощью ИИ был довольно трудным:
- 2021: DALL-E 1, модель с 12 миллиардами параметров, была представлена с ограниченной информацией.
- 2021: GLIDE, модель с 2 миллиардами параметров, была представлена вместе с моделями с 300 миллионами параметров с открытым исходным кодом.
- 2022: Появился DALL-E 2 с 2 миллиардами параметров, сопровождаемый документом unCLIP и API.
- 2023: DALL-E 3 уже появился, и хотя детали могут быть несколько загадочными, одно ясно — он будет интегрироваться с GPT-4 для ChatGPT+ подписчики.
На данный момент визуальные эффекты DALL-E 3 остаются скудными. Здесь нет кодовой базы, сообщений в блоге или подробного сравнения с современной версией (SOTA). OpenAI похоже, держат свои карты близко к груди.
Рекламируется, что модель обладает более глубоким пониманием нюансов и деталей по сравнению со своими предшественниками. Это означает, что преобразование ваших творческих концепций в высокоточные изображения станет более плавным процессом.
Одним из интригующих обещаний DALL-E 3 является его интеграция с ChatGPT. Это означает, что пользователям не придется заниматься созданием сложных подсказок; краткого описания должно быть достаточно, ChatGPT умело генерируя подробные подсказки от вашего имени.
OpenAI также подчеркнул важность контекста в длинных подсказках. DALL-E 3 разработан с учетом многословия, что делает его более адаптированным к контексту, описанному в подробных подсказках.
Тем не менее, как и в любой новой модели ИИ, здесь есть элемент неизведанного. Хотя первые проблески выглядят многообещающе, настоящей лакмусовой бумажкой станет более продолжительное использование. Остаются вопросы о его эффективности и скорости работы.
Вполне вероятно, что DALL-E 3 будет многоэтапным процессом распространения, в котором GPT-4 выступающий в качестве кодировщика текста. Сложная механика этой установки может оставаться окутанной тайной.
Срок доступа к DALL-E 3 установлен на октябрь, первоначально для ChatGPT Плюс и ChatGPT Корпоративный пользовательs, с возможностью более широкого доступа для исследователей после этого.
Похожие страницы:: OpenAIАльтман в Сенате США обсудит риски ИИ |
Затенение и Цензура ДАЛЛ-Э 3
Основным моментом разработки DALL-E 3 был тщательный процесс ограничения его возможностей. Это включало строгое согласование и фильтры, предназначенные для исключения определенных типов контента. Например, модель категорически отказывается создавать изображения известных личностей, копировать произведения искусства в стиле известных художников или создавать любой контент, который считается небезопасным. OpenAIвзыскательные стандарты. Этот стратегический подход касается не только ограничений; это превентивная мера, направленная на защиту компании от потенциальных юридических сложностей.
Тем не менее, помимо этих фильтров и сопоставлений, обнаруживаются некоторые интригующие наблюдения. DALL-E 3, похоже, демонстрирует определенную слабость, когда дело доходит до создания фотореалистичного контента. Вместо создания изображений, которые безупречно имитируют настоящие фотографии, выходные данные имеют ярко выраженное стилизованное качество. Эти изображения, созданные искусственным интеллектом, выглядят почти визуализированными и слегка пластичными. Даже когда к тексту явно подсказывают слово «фотография», результат остается неизменным в своей характерной стилизации.
Стоит отметить, что, несмотря на эти особенности, DALL-E 3 действительно предлагает проблеск замечательного потенциала. Среди его творений некоторые экземпляры демонстрируют поразительное сходство с фотографиями. Имейте в виду, что смоделированный реализм этих изображений не обязательно соответствует тому, как будет выглядеть настоящая фотография того же объекта, особенно если она погружена под воду.
Похожие страницы:: Microsoft представила Designer, первый профессиональный инструмент для преобразования текста в изображение на основе DALL-E 2. |
Особенности и детали DALL-E 3
Давайте на минутку проанализируем пиксели и прочитаем между строк, чтобы понять, что на самом деле предлагает эта новая модель.
Искусство стилизации: Просматривая OpenAIаккаунт в Инстаграм, вы заметите обилие произведений искусства, отличающихся изысканной стилизацией. Несмотря на впечатляющий набор абстрактных композиций и дизайнов, модель, похоже, избегает создания фотореалистичного контента. Акцент здесь делается на эстетике и творчестве, а не на имитации реальности.
Художественные ограничения: DALL-E 3 идет по другому пути, чем его предшественник. Он категорически отказывается создавать изображения в стиле ныне живущих художников, что является резким отходом от DALL-E 2, который мог бы имитировать стили определенных художников. Это может вызвать удивление в творческом сообществе, подобно вялому приему Stable Diffusion 2.0.
Расширение прав и возможностей художников: Стремясь уважать права художников, OpenAI позволяет художникам исключать свои работы из будущих версий DALL-E. Отправляя изображение, права на которое у него есть, художники могут запросить его исключение из результатов модели. Будущие версии DALL-E будут избегать создания контента, напоминающего стиль художника.
Безопасность и цензура: OpenAIПаранойя по поводу безопасности ощутима. Они сотрудничали с внешними «красными командами» для проверки безопасности модели и использовали классификаторы входных данных, чтобы научить модель игнорировать определенные слова, которые могут привести к явному или вредоносному контенту. DALL-E 3 воздерживается от воссоздания образов общественные деятели когда их имена упоминаются явно. Подпадают ли знаменитости под эту категорию, остается неясным, что потенциально может повлиять на качество создаваемых лиц.
Водяные знаки и отслеживание: есть намек на встраивание тегов для отслеживания «изображений, сгенерированных искусственным интеллектом», что указывает на движение к лучшему мониторингу и потенциальному нанесению водяных знаков на сгенерированный контент.
Улучшен текст и руки: OpenAI рекламирует улучшенную генерацию текста и рендеринг вручную, что является обычным утверждением среди конкурентов. Настоящее испытание заключается в реальных результатах, помимо тщательно отобранных примеров.
Пространственное понимание: DALL-E 3 превосходно понимает пространственные отношения, описанные в подсказках. Это расширяет возможности модели создавать сложные ракурсы и композиции, хотя пользователи ждут более конкретных доказательств этого обещания.
Сила подсказок: Суть ДАЛЛ-Э 3 заключается в его быстрых возможностях и интеграции с ChatGPT. Он обещает автоматизацию, скорость и упрощение оперативного проектирования. Здесь наблюдается тенденция к chatGPT создание подсказок, переводя смутные идеи или элементарные подсказки в красноречивые. Улучшенное понимание контекста в DALL-E 3 упрощает процесс, позволяя пользователям сосредоточиться на намерениях, а не на многословии.
Неизведанные территории: Примечательно, что в обсуждении отсутствуют такие аспекты, как закрашивание, закрашивание, генеративная заливка и 3D-моделирование. Отсутствие этих функций может стать ограничением, особенно для пользователей, привыкших к более универсальным моделям.
Детали доступа: DALL-E 3 станет доступен ChatGPT Клиенты Plus и Enterprise в начале октября. Однако особенности выделения кредитов на ChatGPT Плюс пользователи и связанные с этим расходы остаются неясными. Доступ будет предоставляться через API и OpenAI Платформа Labs «позже осенью».
Мастерство интеграции: DALL-E будет легко интегрироваться в продукты партнеров и Microsoft. Ожидайте, что вы станете свидетелем создания презентаций, иллюстраций, дизайнов, логотипов - все в контексте и усиленное с помощью ChatGPT. Эта интеграция станет основной тенденцией, создавая серьезную проблему для таких конкурентов, как Google со своим Бардом и Идеограмма.
Конвергенция LLM и визуального контента: Самый интригующий аспект заключается в сближении моделей большого языка (LLM) и моделей генерации визуального контента. Это означает переход от сложной оперативной разработки к выражению идей на более доступном языке. ИИ будет извлекать контекст и идеи из этих выражений, предлагая творческие возможности, перед которыми трудно устоять.
Похожие страницы:: 50 лучших подсказок преобразования текста в изображение для генераторов искусств на основе искусственного интеллекта Midjourney и ДАЛЛ-И |
DALL-E 3: станьте новым лидером в области создания изображений с помощью ИИ
OpenAIрешение интегрировать DALL-E 3 в ChatGPT экосистема – это стратегический шаг. Эта интеграция предоставляет DALL-E 3 доступ к обширной пользовательской базе данных, насчитывающей 100 миллионов активных пользователей. Этот шаг значительно расширяет доступность DALL-E 3 и может резко повысить его популярность.
В настоящее время Midjourney и Stable Diffusion хвастаться 15 миллионов зарегистрированных пользователей. Однако благодаря этой интеграции DALL-E 3 сможет получить доступ к базе пользователей, в десять раз большей — 100 миллионов пользователей. Это делает ChatGPT Плюс подписка план становится еще более привлекательным, поскольку он предлагает доступ к чат-боту, аналитическим инструментам и созданию изображений — и все это по доступной цене.
Интеграция не только выгодна для существующих пользователей, но и служит мощным магнитом для новых пользователей. Это расширяет OpenAI охват и популярность экосистемы, привлекая людей, которые ищут контент-решения, созданные с помощью искусственного интеллекта.
Этот стратегический шаг призван повысить OpenAIвыручка и другие ключевые показатели. Инвесторы компании, скорее всего, отнесутся к такому развитию событий положительно, особенно в свете недавних событий. Снижение объема трафика на 20% летом.
Читайте другие связанные темы:
Условия использования
В соответствии с Руководство трастового проектаОбратите внимание, что информация, представленная на этой странице, не предназначена и не должна интерпретироваться как юридическая, налоговая, инвестиционная, финансовая или любая другая форма консультации. Важно инвестировать только то, что вы можете позволить себе потерять, и обращаться за независимой финансовой консультацией, если у вас есть какие-либо сомнения. Для получения дополнительной информации мы предлагаем обратиться к положениям и условиям, а также к страницам справки и поддержки, предоставленным эмитентом или рекламодателем. MetaversePost стремится предоставлять точную и объективную отчетность, однако рыночные условия могут быть изменены без предварительного уведомления.
Об авторе
Дамир — руководитель группы, менеджер по продукту и редактор в Metaverse Post, охватывающие такие темы, как AI/ML, AGI, LLM, Metaverse и Web3-связанные поля. Его статьи ежемесячно привлекают огромную аудиторию, насчитывающую более миллиона пользователей. Похоже, он эксперт с 10-летним опытом работы в области SEO и цифрового маркетинга. Дамир упоминается в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и другие издания. Он путешествует между ОАЭ, Турцией, Россией и СНГ в качестве цифрового кочевника. Дамир получил степень бакалавра в области физики, что, по его мнению, дало ему навыки критического мышления, необходимые для достижения успеха в постоянно меняющемся мире Интернета.
Другие статьиДамир — руководитель группы, менеджер по продукту и редактор в Metaverse Post, охватывающие такие темы, как AI/ML, AGI, LLM, Metaverse и Web3-связанные поля. Его статьи ежемесячно привлекают огромную аудиторию, насчитывающую более миллиона пользователей. Похоже, он эксперт с 10-летним опытом работы в области SEO и цифрового маркетинга. Дамир упоминается в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и другие издания. Он путешествует между ОАЭ, Турцией, Россией и СНГ в качестве цифрового кочевника. Дамир получил степень бакалавра в области физики, что, по его мнению, дало ему навыки критического мышления, необходимые для достижения успеха в постоянно меняющемся мире Интернета.