Звіт про новини Технологія
Вересень 21, 2023

DALL-E 3 Release посилюється OpenAIВплив, Відхід Midjourney та Stable Diffusion Позаду

Коротко

DALL-E 3 налаштовано на повну інтеграцію GPT-4, спеціально розроблений для ChatGPT+ передплатники.

DALL-E 3 утримується від відтворення зображень публічних діячів, якщо їхні імена явно згадуються.

Доступ до DALL-E 3 запланований на жовтень.

OpenAI представила своє останнє творіння: ВІД-Є 3. На відміну від своїх попередників, DALL-E 3 зосереджується на вдосконаленні дрібниць, вирішуючи такі проблеми, як написи та складні деталі тіла, як-от пальці. Результат? Масив естетично привабливих зображень без потреби в складних підказках або обхідних шляхах.

DALL-E 3 Release посилюється OpenAIВплив, Відхід Midjourney та  Stable Diffusion Позаду

Важливо зазначити, що цей випуск не містить вичерпного набору деталей впровадження, статей або API. Натомість DALL-E 3 налаштовано на повну інтеграцію GPT-4, спеціально розроблений для ChatGPT+ передплатники.

Ця подія може бути не сейсмічним зрушенням у ландшафті штучного інтелекту, а радше кроком вперед у співпраці між моделями. Багато хто очікує наступного Stable Diffusion модель запропонує ще більшу вишуканість і художню привабливість.

Щоб поставити це в контекст, OpenAIПодорож користувача через створення зображень ШІ була справжньою:

  • 2021: DALL-E 1, модель із 12 мільярдами параметрів, була представлена ​​з обмеженою інформацією.
  • 2021: GLIDE, модель із 2 мільярдами параметрів, була оприлюднена разом із моделями з відкритим кодом із 300 мільйонами параметрів.
  • 2022: DALL-E 2 надійшов із 2 мільярдами параметрів, а також документом unCLIP та API.
  • 2023: DALL-E 3 з’явився, і хоча деталі можуть бути дещо загадковими, ясно одне — він інтегруватиметься з GPT-4 та цінності ChatGPT+ передплатники.

На даний момент візуальні ефекти DALL-E 3 залишаються дещо рідкісними. Немає кодової бази, публікації в блозі чи детального порівняння з найсучаснішим (SOTA). OpenAI здається, вони тримають свої карти біля грудей.

DALL-E 3 Release посилюється OpenAIВплив, Відхід Midjourney та  Stable Diffusion Позаду

Модель рекламується як глибше розуміння нюансів і деталей порівняно з попередниками. Це означає, що перетворення ваших творчих концепцій у високоточні зображення буде легшим процесом.

Однією з цікавих обіцянок DALL-E 3 є його інтеграція з ChatGPT. Це означає, що користувачам не потрібно буде боротися з створенням складних підказок; досить короткого опису, с ChatGPT вміло створювати детальні підказки від вашого імені.

OpenAI також підкреслив важливість контексту в довгих підказках. DALL-E 3 створено для підтримки багатослівності, що робить його більш адаптованим до контексту, описаного в розширених підказках.

Проте, як і в будь-якій новій моделі штучного інтелекту, є елемент невідомого. Хоча початкові проблиски виглядають обнадійливо, справжній лакмусовий папірець прийде за умови тривалого використання. Виникають питання щодо його ефективності та швидкості роботи.

Ймовірно, що DALL-E 3 буде багатоетапним процесом розповсюдження, з GPT-4 служить кодувальником тексту. Складна механіка цієї установки може залишатися оповитою таємницею.

Час доступу до DALL-E 3 призначено на жовтень, спочатку на ChatGPT Плюс і ChatGPT Корпоративний користувачs, з можливістю ширшого доступу для дослідників після цього.

споріднений: OpenAIАльтман у Сенаті США для обговорення ризиків ШІ

Nuances та цензура DALL-E 3

Головною метою розробки DALL-E 3 був ретельний процес обмеження його можливостей. Це передбачало суворе вирівнювання та фільтри, призначені для виключення певних типів вмісту. Наприклад, модель категорично відмовляється створювати зображення відомих особистостей, копіювати твори мистецтва в стилі відомих художників або створювати будь-який контент, який вважає небезпечним OpenAIвимогливі стандарти. Цей стратегічний підхід стосується не лише обмежень; це проактивний захід, спрямований на захист компанії від потенційних юридичних ускладнень.

Однак поза цими фільтрами та вирівнюваннями виявляються деякі інтригуючі спостереження. Схоже, DALL-E 3 демонструє певну слабкість, коли справа доходить до створення фотореалістичного контенту. Замість створення зображень, які бездоганно імітують справжні фотографії, вихід має виразну стилізовану якість. Ці зображення, створені за допомогою штучного інтелекту, випромінюють майже відтворений і трохи пластичний вигляд. Навіть якщо вказується слово «фотографія», результат залишається закріпленим у своїй характерній стилізації.

Підказка №1
Підказка №1: фотографія крупним планом рака-відлюдника, що сидить у мокрому піску, з морською піною поблизу та підкресленими деталями його панцира та текстурою піску.
Підказка №2
Підказка №2: Яскравий жовтий диван у формі банана стоїть у затишній вітальні, його вигин обіймає купу різнокольорових подушок. на дерев’яній підлозі візерунчастий килим додає нотку еклектичного шарму, а рослина в горщику сидить у кутку, простягаючись до сонячного світла, що проникає крізь вікно.
Підказка №3
Підказка №3: ​​фотографія затонулого корабля, розташованого на дні океану. Морські рослини заволоділи дерев’яною конструкцією, а риби плавають у її порожнистих просторах і випливають з них. Навколо розкидані затонулі скарби та старі гармати, які дають змогу зазирнути в минуле.

Варто зазначити, що незважаючи на ці особливості, DALL-E 3 дійсно пропонує проблиск дивовижного потенціалу. Серед його творінь деякі екземпляри демонструють разючу схожість з фотографіями. Майте на увазі, що імітація реалістичності цих зображень не обов’язково збігається з тим, як виглядала б справжня фотографія того самого об’єкта, особливо якщо вона занурена під воду.

споріднений: Microsoft представила Designer, перший професійний інструмент для перетворення тексту в зображення на основі DALL-E 2

Функції та деталі DALL-E 3

Давайте трохи поглянемо на пікселі та прочитаємо між рядків, щоб зрозуміти, що насправді пропонує ця нова модель.

Мистецтво стилізації: Переглядаючи OpenAIобліковий запис Instagram, ви помітите велику кількість творів мистецтва, що характеризуються вишуканою стилізацією. Незважаючи на вражаючий набір абстрактних композицій і дизайнів, модель, здається, уникає створення фотореалістичного вмісту. Тут акцент робиться на естетиці та креативності, а не на імітації реальності.

Художні обмеження: DALL-E 3 має інший шлях, ніж його попередник. Він категорично відмовляється створювати зображення в стилі живих художників, що є різким відходом від DALL-E 2, який міг би імітувати стилі певних художників. Це може підняти брови у творчій спільноті, подібно до прохолодного прийому Stable Diffusion 2.0.

Розширення можливостей художників: На шляху до поваги прав митців, OpenAI дозволяє художникам виключати свої роботи з майбутніх версій DALL-E. Надсилаючи зображення, на яке вони володіють правами, художники можуть вимагати виключення його з результатів моделі. У подальших ітераціях DALL-E уникатиметься створення вмісту, схожого на стиль художника.

Безпека та цензура: OpenAIПараноя щодо безпеки відчутна. Вони співпрацювали із зовнішніми «червоними командами», щоб перевірити безпеку моделі та використали класифікатори введення, щоб навчити модель ігнорувати певні слова, які можуть призвести до відвертого чи шкідливого вмісту. DALL-E 3 утримується від відтворення зображень громадські діячі коли їхні імена прямо згадуються. Залишається невизначеним, чи підпадають під цю категорію знаменитості, що потенційно може вплинути на якість створених облич.

Водяні знаки та відстеження: Є натяк на вбудовування тегів для відстеження «згенерованих штучним інтелектом зображень», що вказує на перехід у бік кращого моніторингу та потенційного водяного знака, створеного вмісту.

Покращено текст і руки: OpenAI рекламує покращене генерування тексту та рендеринг рукою, поширене твердження серед конкурентів. Справжнє випробування полягає в фактичному виході за межі вибраних прикладів.

Просторове розуміння: DALL-E 3 чудово розуміє просторові відносини, описані в підказках. Це покращує здатність моделі створювати складні ракурси та композиції, хоча користувачі чекають більш конкретних доказів цієї обіцянки.

Сила підказок: суть ВІД-Є 3 полягає в його оперативних можливостях та інтеграції з ChatGPT. Він обіцяє автоматизацію, швидкість і спрощення швидкого проектування. Тенденція тут до chatGPT генерування підказок, перекладаючи туманні ідеї чи рудиментарні підказки у красномовні. Покращене розуміння контексту DALL-E 3 спрощує процес, дозволяючи користувачам зосереджуватися на намірах, а не на багатослівності.

Незвідані території: Особливо відсутні в обговоренні такі аспекти, як замальовування, замальовування, генеративна заливка та 3D-моделювання. Відсутність цих функцій може бути обмеженням, особливо для користувачів, які звикли до більш універсальних моделей.

Деталі доступу: DALL-E 3 стане доступним для ChatGPT Клієнти Plus і Enterprise на початку жовтня. Проте особливості щодо виділення кредитів для ChatGPT Плюс користувачі та пов’язані з ними витрати залишаються незрозумілими. Доступ надаватиметься через API та OpenAI Платформа Labs «пізніше восени».

Спроможність інтеграції: DALL-E планується повністю інтегрувати в продукти партнерів і Microsoft. Очікуйте стати свідком створення презентацій, ілюстрацій, дизайнів, логотипів, усе в контексті та розширене за допомогою ChatGPT. Ця інтеграція має стати основною, створюючи серйозний виклик для таких конкурентів, як Google зі своїм Бардом та ідеограма.

Конвергенція LLM і візуального контенту: Найбільш інтригуючий аспект полягає в конвергенції великих мовних моделей (LLM) і моделей генерації візуального контенту. Це означає перехід від складної оперативної розробки до вираження ідей більш доступною мовою. ШІ збиратиме контекст та ідеї з цих виразів, пропонуючи творчі можливості, перед якими важко встояти.

споріднений: 50 найпопулярніших підказок перетворення тексту в зображення для AI Art Generators Midjourney і DALL-E

DALL-E 3: станьте новим лідером у створенні зображень AI

OpenAIрішення інтегрувати DALL-E 3 у ChatGPT екосистема є стратегічним кроком. Ця інтеграція надає DALL-E 3 доступ до величезної бази даних користувачів із 100 мільйонів активних користувачів. Цей крок значно покращує доступність DALL-E 3 і має потенціал для катапультування його популярності.

В даний час Midjourney та Stable Diffusion хвалитися навколо Мільйон зареєстрованих користувачів 15. Однак завдяки цій інтеграції DALL-E 3 отримає доступ до бази користувачів, яка в десять разів більша — 100 мільйонів користувачів. Це робить ChatGPT Плюс підписка план стає ще привабливішим, оскільки пропонує доступ до чат-бота, аналітичних інструментів і створення зображень за доступною ціною.

Інтеграція є не тільки вигідною для існуючих користувачів, але також служить потужним магнітом для нових користувачів. Це розширює OpenAI охоплення та популярність екосистеми, залучаючи людей, які шукають рішення для контенту, створеного ШІ.

Цей стратегічний крок має на меті посилення OpenAIдохід та інші ключові показники. Інвестори компанії, ймовірно, прихильно сприймуть цей розвиток подій, особливо в світлі останніх подій Зниження обсягу трафіку на 20%. протягом літа.

DALL-E 3 Release посилюється OpenAIВплив, Відхід Midjourney та  Stable Diffusion Позаду
ChatGPT Веб-трафік у вересні впав на 20% і продовжує стрімко падати

Читайте більше пов’язаних тем:

відмова

Відповідно до Правила проекту Trust, будь ласка, зверніть увагу, що інформація, надана на цій сторінці, не призначена і не повинна тлумачитися як юридична, податкова, інвестиційна, фінансова або будь-яка інша форма консультації. Важливо інвестувати лише те, що ви можете дозволити собі втратити, і звернутися за незалежною фінансовою порадою, якщо у вас виникнуть сумніви. Щоб отримати додаткову інформацію, ми пропонуємо звернутися до положень та умов, а також до сторінок довідки та підтримки, наданих емітентом або рекламодавцем. MetaversePost прагне до точного, неупередженого звітування, але ринкові умови можуть змінюватися без попередження.

про автора

Дамір є керівником групи, менеджером із продуктів і редактором Metaverse Post, що охоплює такі теми, як AI/ML, AGI, LLMs, Metaverse тощо Web3- суміжні поля. Його статті щомісяця приваблюють величезну аудиторію понад мільйон користувачів. Здається, він є експертом із 10-річним досвідом роботи в SEO та цифровому маркетингу. Даміра згадували в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto та інші видання. Він подорожує між ОАЕ, Туреччиною, Росією та СНД як цифровий кочівник. Дамір отримав ступінь бакалавра з фізики, що, на його думку, дало йому навички критичного мислення, необхідні для досягнення успіху в Інтернеті, який постійно змінюється. 

інші статті
Дамір Ялалов
Дамір Ялалов

Дамір є керівником групи, менеджером із продуктів і редактором Metaverse Post, що охоплює такі теми, як AI/ML, AGI, LLMs, Metaverse тощо Web3- суміжні поля. Його статті щомісяця приваблюють величезну аудиторію понад мільйон користувачів. Здається, він є експертом із 10-річним досвідом роботи в SEO та цифровому маркетингу. Даміра згадували в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto та інші видання. Він подорожує між ОАЕ, Туреччиною, Росією та СНД як цифровий кочівник. Дамір отримав ступінь бакалавра з фізики, що, на його думку, дало йому навички критичного мислення, необхідні для досягнення успіху в Інтернеті, який постійно змінюється. 

Hot Stories
Приєднуйтеся до нашої розсилки.
Останні новини

Від Ripple до The Big Green DAO: як криптовалютні проекти сприяють благодійності

Давайте розглянемо ініціативи, які використовують потенціал цифрових валют для благодійних цілей.

Дізнайтеся більше

AlphaFold 3, Med-Gemini та інші: як AI трансформує охорону здоров’я у 2024 році

ШІ проявляється різними способами в охороні здоров’я, від виявлення нових генетичних кореляцій до розширення можливостей роботизованих хірургічних систем...

Дізнайтеся більше
Детальніше
Читати далі
QCP Capital: Економіка США демонструє ознаки перегріву, криптовалютний ринок стикається з трьома тестами економічних даних цього тижня
ринки Звіт про новини Технологія
QCP Capital: Економіка США демонструє ознаки перегріву, криптовалютний ринок стикається з трьома тестами економічних даних цього тижня
Січень 13, 2025
Аналітики пояснюють, чому падіння цін на біткойн у січні може свідчити про більші прибутки
Думка Бізнес ринки
Аналітики пояснюють, чому падіння цін на біткойн у січні може свідчити про більші прибутки
Січень 13, 2025
CESS представляє рішення для децентралізованих даних на зустрічі GBA для просування охорони здоров’я та розвитку розумних міст
Звіт про новини Технологія
CESS представляє рішення для децентралізованих даних на зустрічі GBA для просування охорони здоров’я та розвитку розумних міст
Січень 13, 2025
Fractal підтримує протокол Nubit Goldinals, сприяючи стандартизації біткойнів
Звіт про новини Технологія
Fractal підтримує протокол Nubit Goldinals, сприяючи стандартизації біткойнів
Січень 13, 2025
CRYPTOMERIA LABS PTE. LTD.