Звіт про новини Технологія
Липень 27, 2023

Stability AI Запуски Stable Diffusion XL 1.0 для швидкого створення 1-мегапіксельних зображень

Коротко

Stability AI випустила свій останній продукт SDXL 1.0, інструмент для створення тексту в зображення з покращеною якістю зображення та зручним інтерфейсом.

Маючи 3.5 мільярда параметрів, він може створювати 1-мегапіксельні зображення з різними пропорціями.

Модель створена для оптимізації перетворення тексту в зображення процес генерації та включає функції тонкого налаштування, такі як ControlNet, отримані в результаті досліджень Стенфордського університету.

SDXL 1.0 оптимізовано для споживчих графічних процесорів із ємністю 8 ГБ VRAM і однаково ефективний у доступних хмарних інсталяціях.

Програмне забезпечення пропонує розширене тонке налаштування, дозволяючи генерувати спеціальний LoRA або контрольні точки з меншими витратами даних.

Співтовариство штучного інтелекту може очікувати оновлень найближчим часом, і SDXL 1.0 може генерувати передові концепції, такі як складні деталі або складні просторові композиції.

Інструмент із відкритим вихідним кодом доступний на GitHub, що сприяє прозорості та співпраці всередині спільноти.

Stable Diffusion XL 1.0 (SDXL 1.0), найновіший продукт від Stability AI, нарешті було звільнено. Цей інструмент, який позиціонується як остання розробка в генерації тексту в зображення, виділяється покращеною якістю зображення та зручним інтерфейсом.

Stability AI Запуски Stable Diffusion XL 1.0 для швидкого створення 1-мегапіксельних зображень
Кредит: стабільність.ai
споріднений: Акції NVIDIA зросли на 26% після високих прибутків у першому кварталі завдяки зростанню попиту на графічні процесори зі штучним інтелектом

Хоча багато представників індустрії штучного інтелекту постійно вдосконалюють свої платформи, Stability AIНедавній випуск SDXL 1.0 показує багатообіцяючий прогрес. Вражаючі 3.5 мільярда параметрів моделі дозволяють швидко виробляти 1-мегапіксельні зображення в різних співвідношеннях сторін. Джо Пенна, директор прикладного машинного навчання в Stability AI, наголосив на можливостях моделі в розмові з TechCrunch. Він підкреслив, як його можна налаштувати та як ви можете налаштувати концепції та стилі зображення, використовуючи базові підказки обробки природної мови. За допомогою цих функцій можна полегшити завдання користувачів, дотримуючись чітких інструкцій для створення складних дизайнів.

Stability AI схоже, вирішив проблеми, поширені в секторі штучного інтелекту, зокрема щодо створення тексту. Примітно, що багато передових моделей перетворення тексту в зображення часто не вистачають, коли їм доводиться створювати розбірливий текст, особливо в таких складних стилях, як каліграфія. Однак SDXL 1.0 продемонстрував майстерність розширеного генерування тексту.

Що ще відрізняє SDXL 1.0, так це його конкурентне позиціонування порівняно з іншими головними конкурентами, такими як Midjourney та Adobe Firefly обслуговування. Нова модель підкреслює вдосконалені процеси покращення зображення, що забезпечує насиченіші кольори, чудове освітлення та покращений контраст. Крім того, включення функції тонкого налаштування полегшує створення індивідуальних зображень.

Розробка SDXL 1.0 використовувала спрощений підхід до навчання, виграючи від великої бази параметрів, позиціонуючи його як ідеальну основу для різноманітних інструментів і можливостей. Розповідаючи про його атрибути, Емад Мостаке, генеральний директор компанії Stability AI, заявив, що SDXL 1.0 було ретельно розроблено для оптимізації генерація тексту в зображення процес. Це було додатково збагачено за допомогою ControlNet, отриманого в результаті досліджень Стенфордського університету, що полегшує розширені можливості тонкого налаштування та композиції.

Примітною особливістю моделі SDXL 1.0 є її дизайн, орієнтований на користувача. На відміну від тривалих підказок для отримання бажаних результатів, модель дозволяє користувачам видавати складні багатокомпонентні директиви, стисло описуючи намір меншою кількістю слів, ніж попередні моделі. На даний момент ця інноваційна модель доступна на багатьох платформах, включаючи служби Amazon Bedrock і Amazon SageMaker Jumpstart.

Підвищена продуктивність на споживчих графічних процесорах і розширені функції тонкого налаштування

Згенероване зображення SDXL 1.0
Згенероване зображення SDXL 1.0
споріднений: Stability AI залучає 101 мільйон доларів, оцінка завершується на рівні 1 мільярда доларів

Розроблений з урахуванням сумісності, SDXL 1.0 оптимізований для споживчих графічних процесорів із ємністю 8 ГБ відеопам’яті та однаково ефективний у доступних хмарних інсталяціях.

Особливості та сумісність:

Запуск SDXL 1.0 демонструє прагнення Stability забезпечити ефективні та доступні рішення ШІ для користувачів. Одним із ключових висновків із оголошення є здатність програмного забезпечення бездоганно працювати на стандартних споживчих графічних процесорах. Для користувачів це означає потенціал для оптимальної продуктивності без потреби у висококласному або спеціалізованому обладнанні.

Покращення в тонкому налаштуванні:

У SDXL 1.0 Stability включені функції, які спрощують процес перенавчання моделі для унікальних наборів даних. Поточна модель дозволяє генерувати користувацькі LoRA або контрольні точки зі зменшеними накладними даними, що відкриває шлях для ефективнішої та швидшої адаптації моделі до конкретних потреб. Крім того, є натяк на майбутнє як Stability AI команда займається розробкою розширених елементів керування структурами, стилями та композиціями, що відповідають конкретним завданням. Зокрема, T2I/ControlNet, який спеціалізується на SDXL, вже на горизонті. Хоча ці досягнення залишаються на стадії перед бета-версією, спільнота ШІ та користувачі можуть очікувати оновлень у найближчому майбутньому.

Відтворення розширених концепцій:

SDXL 1.0 демонструє свою здатність створювати концепції, які раніше були складними для моделей зображень. Це включає відтворення складних деталей, таких як руки та текст, або навіть більш складних просторових композицій, таких як сцени, що зображують жінку на задньому плані, яка переслідує собаку на передньому плані. Ця функція особливо важлива, оскільки вказує на стрибок у здатності програмного забезпечення інтерпретувати та відтворювати нюанси та багатогранні сценарії.

Доступність відкритого коду:

Для розробників та ентузіастів, зацікавлених у глибшому дослідженні, Stability опублікувала ваги та код для SDXL 1.0 на GitHub. Цей крок не лише сприяє прозорості, але й сприяє спільному розвитку та інноваціям у спільноті.

Спробуй:

Для тих, хто хоче перевірити можливості SDXL 1.0, Stability інтегрувала його в такі платформи, як DreamStudio та ClipDrop. Крім того, через Discord доступні інтерактивні сеанси та потенційні демонстрації, що дозволяє користувачам на власні очі випробувати функції інструменту.

Докладніше про ШІ:

відмова

Відповідно до Правила проекту Trust, будь ласка, зверніть увагу, що інформація, надана на цій сторінці, не призначена і не повинна тлумачитися як юридична, податкова, інвестиційна, фінансова або будь-яка інша форма консультації. Важливо інвестувати лише те, що ви можете дозволити собі втратити, і звернутися за незалежною фінансовою порадою, якщо у вас виникнуть сумніви. Щоб отримати додаткову інформацію, ми пропонуємо звернутися до положень та умов, а також до сторінок довідки та підтримки, наданих емітентом або рекламодавцем. MetaversePost прагне до точного, неупередженого звітування, але ринкові умови можуть змінюватися без попередження.

про автора

Дамір є керівником групи, менеджером із продуктів і редактором Metaverse Post, що охоплює такі теми, як AI/ML, AGI, LLMs, Metaverse тощо Web3- суміжні поля. Його статті щомісяця приваблюють величезну аудиторію понад мільйон користувачів. Здається, він є експертом із 10-річним досвідом роботи в SEO та цифровому маркетингу. Даміра згадували в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto та інші видання. Він подорожує між ОАЕ, Туреччиною, Росією та СНД як цифровий кочівник. Дамір отримав ступінь бакалавра з фізики, що, на його думку, дало йому навички критичного мислення, необхідні для досягнення успіху в Інтернеті, який постійно змінюється. 

інші статті
Дамір Ялалов
Дамір Ялалов

Дамір є керівником групи, менеджером із продуктів і редактором Metaverse Post, що охоплює такі теми, як AI/ML, AGI, LLMs, Metaverse тощо Web3- суміжні поля. Його статті щомісяця приваблюють величезну аудиторію понад мільйон користувачів. Здається, він є експертом із 10-річним досвідом роботи в SEO та цифровому маркетингу. Даміра згадували в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto та інші видання. Він подорожує між ОАЕ, Туреччиною, Росією та СНД як цифровий кочівник. Дамір отримав ступінь бакалавра з фізики, що, на його думку, дало йому навички критичного мислення, необхідні для досягнення успіху в Інтернеті, який постійно змінюється. 

Hot Stories
Приєднуйтеся до нашої розсилки.
Останні новини

Від Ripple до The Big Green DAO: як криптовалютні проекти сприяють благодійності

Давайте розглянемо ініціативи, які використовують потенціал цифрових валют для благодійних цілей.

Дізнайтеся більше

AlphaFold 3, Med-Gemini та інші: як AI трансформує охорону здоров’я у 2024 році

ШІ проявляється різними способами в охороні здоров’я, від виявлення нових генетичних кореляцій до розширення можливостей роботизованих хірургічних систем...

Дізнайтеся більше
Приєднуйтесь до нашої спільноти інноваційних технологій
Детальніше
Читати далі
10 найкращих безкоштовних інструментів штучного інтелекту для створення вмісту, редагування відео тощо
AI Wiki Digest Освіта Стиль життя Софтвер Технологія
10 найкращих безкоштовних інструментів штучного інтелекту для створення вмісту, редагування відео тощо
Травень 14, 2024
Комісія з цінних паперів Гонконгу попереджає про шахрайство Deepfake, націлене на криптоіндустрію: наслідки для безпеки інвесторів
Стиль життя Безпека Wiki Софтвер Розповіді та огляди Технологія
Комісія з цінних паперів Гонконгу попереджає про шахрайство Deepfake, націлене на криптоіндустрію: наслідки для безпеки інвесторів
Травень 14, 2024
Ripple і Evmos співпрацюють над розробкою XRP Ledger EVM Sidechain з технологією EvmOS
Business Звіт про новини Технологія
Ripple і Evmos співпрацюють над розробкою XRP Ledger EVM Sidechain з технологією EvmOS
Травень 14, 2024
5ireChain ініціює стимульований «Testnet Thunder: GA» для мережевого стрес-тестування, запрошує користувачів до участі в Airdrop Нагороди
Звіт про новини Технологія
5ireChain ініціює стимульований «Testnet Thunder: GA» для мережевого стрес-тестування, запрошує користувачів до участі в Airdrop Нагороди
Травень 14, 2024
CRYPTOMERIA LABS PTE. LTD.