інтерв'ю Art ТПВ
Травень 01, 2023

DeepFloyd і не тільки: досліджуємо новітнє мистецтво ШІ з генеральним директором NightCafe Studio

Коротко

Під час ексклюзивного інтерв’ю генеральний директор NightCafe Studio надав цінні ідеї та погляди на мистецтво, створене ШІ.

Ангус Рассел представив DeepFloyd – новий алгоритм, розроблений партнером NightCafe Studio, Stability AI, який працює в просторі пікселів і використовує модель великої мови (LLM) для створення зображень.

Студія NightCafe — це AI Art Generator, який дозволяє користувачам створювати приголомшливе футуристичне мистецтво за лічені секунди за допомогою штучного інтелекту. Заснована Ангус Рассел Чотири роки тому студія NightCafe виникла через розчарування самого Ангуса через те, що він не зміг знайти витвори мистецтва, які б резонували з ним. Керуючись знанням про існування алгоритмів передачі стилю, він шукав веб-сайт, який би дозволив йому створювати персоналізоване мистецтво за допомогою передачі стилю та друкувати його. 

На його розчарування, він не міг знайти такої платформи. Однак ця невдача породила в ньому новаторську ідею. Він вирішив створити додаток для передачі нейронних стилів для створення мистецтва, створеного штучним інтелектом, і опублікував його на Reddit.

NightCafe Studio виникла як платформа для створення тексту в зображення, що робить її першою у своєму роді. Ця унікальна функція призвела до значного зростання як доходу, так і бази користувачів. Відтоді платформа залишається в авангарді генеративного штучного інтелекту, залучаючи велику спільноту ентузіастів, які із задоволенням використовують генератор для створення приголомшливих творів мистецтва. Сьогодні NightCafe Studio широко вважається одним із найпопулярніших та інноваційних генераторів зображень AI.

Під час інтерв’ю з Ангусом Расселом ми досліджували переваги та обмеження мистецтва, створеного штучним інтелектом, дедалі більшого використання штучного інтелекту в світі мистецтва та найновішого алгоритму створення зображень ШІ DeepFloyd.

студія нічного кафе
Сіднейський оперний театр: одне з перших зображень Ангуса, створених штучним інтелектом

Поява створеного ШІ мистецтва

В останнє десятиліття мистецька індустрія стала свідком поступового проникнення ШІ та машинного навчання (ML). Ці передові технології представили деякі захоплюючі нові концепції, такі як Deepfakes і DALL-E, які привернули значну увагу в усьому світі. Сьогодні мистецька індустрія не може дозволити собі ігнорувати величезний вплив штучного інтелекту, який зараз викликає давно назрілу революцію в цьому секторі.

Ангус розповів, як NightCafe Studio зазнала стрибків зростання під час випуску Stable Diffusion, модель перетворення тексту в зображення, яку його компанія випустила в день запуску. Відтоді бар’єр для створення подібних інструментів було знижено завдяки відкритому коду алгоритмів і зразків коду.

Засновник NightCafe Studio вважає, що створення мистецтва ШІ стосується не лише кінцевого продукту, а й процесу його створення. Він розглядає це як форму терапії та релаксації, що дозволяє людям виражати себе унікальним і творчим способом. Багато людей, які ніколи не вважали себе творчими, виявили свої мистецькі здібності завдяки зображенням, створеним ШІ. Ця філософія відображена в користувальницькому інтерфейсі платформи, який розроблений таким чином, щоб бути зручним і доступним для художників будь-якого рівня кваліфікації. 

Тільки в NightCafe Studio вже є від двох до трьох мільйонів користувачів на місяць, які генерують близько мільйона зображень на день. Stability AI, компанія з відкритим вихідним кодом, що створює штучний інтелект, заявив, що вони мали понад 10 мільйонів користувачів, які були активними щодня незабаром після запуску Stable Diffusion.

Рекомендується: 10+ найкращих арт-генераторів штучного інтелекту 2023 року: Midjourney, DALL-E, NightCafe, Artbreeder

DeepFloyd IF: новий алгоритм генерації зображень штучного інтелекту, який змінює гру

NightCafe Studio впроваджує новий алгоритм Stability AI званий DeepFloyd, який обіцяє революціонізувати спосіб створення зображень за допомогою штучного інтелекту.

DeepFloyd, який зараз перебуває в бета-версії, є новою моделлю перетворення тексту в зображення, яка може створювати вражаючі зображення з описів природною мовою. Він заснований на новій архітектурі, яка поєднує велику мовну модель із трьома моделями дифузії. Його натхненно Imagen, подібною моделлю, розробленою Google Research, але так і не оприлюдненою.

Модель може генерувати чіткі та цілісні зображення з текстом і об’єктами в різних просторових співвідношеннях, що є складним завданням для більшості інших моделей тексту в зображення. Це досягається за допомогою великої мовної моделі T5-XXL-1.1 як кодера тексту та значної кількості шарів перехресного звернення уваги текст-зображення, які забезпечують кращу підказку та альянс зображень. 

DeepFloyd також може створювати зображення з нестандартним співвідношенням сторін і має високий ступінь фотореалізму. Крім того, він дозволяє здійснювати безперервний переклад зображення в зображення, що означає, що стиль, візерунки та деталі вихідного зображення можна змінювати, зберігаючи базову форму вихідного зображення без необхідності тонкого налаштування.

Новий алгоритм працює інакше, ніж Stable Diffusion. DeepFloyd використовує піксельний простір і велику мовну модель (LLM), тоді як Stable Diffusion використовує прихований простір і фіксовану модель CLIP. DeepFloyd також використовує численні процеси дифузії для створення зображень, хоча Stable Diffusion використовує лише один.

DeepFloyd — це назва дослідницької групи, яка розробила алгоритм, а сам алгоритм називається IF. До дослідницької групи входить багато тих самих людей, які творили GPT-3попередник, GPT-2, а також попередню найсучаснішу модель мови під назвою RuGPT.

Деякі припущення припускають, що назва IF може бути натхненна однойменною піснею Pink Floyd, на що натякає біографія дослідницької групи алгоритмів у соціальних мережах.

Докладніше про алгоритм тут.

студія нічного кафе deepfloyd
Зображення, створені за допомогою DeepFloyd IF. Джерело: Stability AI

Порівняння обмежень штучного інтелекту та цифрового мистецтва

Одним із основних обмежень ШІ є текст, хоча DeepFloyd вирішує цю проблему. Іншим обмеженням є складність отримання зображення саме таким, яким ви бажаєте, особливо без підказки експерта. ШІ також не вміє розуміти та інтерпретувати культурні та соціальні контексти, які формують людське мистецтво. Тому мистецтво, створене штучним інтелектом, іноді може створювати роботи, які здаються недоречними або культурно нечутливими.

Однак зображення, створені штучним інтелектом, все ще можуть бути красивими, а часом навіть кращими за початкову ідею, якщо користувач готовий бути здивованим, сказав Ангус. Крім того, є способи змінити створені зображення за допомогою алгоритмів AI або Photoshop. Хоча отримання точного зображення зараз є областю активних досліджень, досягнуто значного прогресу. Можливо, скоро стане можливим мати повний контроль над усіма аспектами зображення. 

Штучний інтелект покладається на зображення та мистецтво, які існують в Інтернеті, як натхнення, але лише на ті, на яких він навчався. Різні алгоритми, наприклад Midjourney, DALL-E та Stable Diffusion, навчаються на різних наборах даних, що означає, що вони можуть працювати краще на певних типах зображень. 

Нещодавно дослідники досліджували вплив видалення зображень низької якості з навчальних наборів даних на покращення результатів ШІ. Відфільтровуючи ці низькоякісні зображення, отриманий набір даних може стати меншим, але вищою якістю, що призведе до кращих результатів без збільшення розміру моделей штучного інтелекту або потреби дорожчого обладнання. Ангус поділився, що цей підхід є багатообіцяючим способом покращити якість зображень, створених ШІ, не покладаючись на більші та ресурсомісткі моделі.

Однією з проблем штучного інтелекту в мистецтві є те, що він може знецінити роботу художників-людей, які витрачають багато часу на створення мистецтва, тоді як ШІ здатний створювати мистецтво за лічені секунди. Однак існує певна нематеріальна якість людського мистецтва, яку може бути важко відтворити штучному інтелекту, наприклад, емоційна глибина та складність, які часто присутні у творах, створених людьми. NightCafe Studio вважає, що штучний інтелект — це не стільки створення мистецтва для комерційних цілей, скільки задоволення від самого творчого процесу.

«Мистецтво, створене людьми, завжди матиме цінність, оскільки воно відображає зусилля та майстерність художника, тоді як мистецтво, створене ШІ, не має такої ж внутрішньої цінності»,

- сказав Ангус.

Етичною проблемою, пов’язаною з ШІ в мистецтві, є використання публічних зображень для навчання алгоритмів ШІ, які можуть не належати компанії, яка навчає ШІ. Хоча на даний момент закони не порушуються, це викликає питання щодо згоди та конфіденційності. Такі компанії з відкритим кодом OpenAI і DALL-E працюють над тим, щоб зробити процес більш етичним, але це питання залишається відкритим. У майбутньому можуть бути правила щодо використання зображень для навчання ШІ мистецтву.

Незважаючи на ці занепокоєння, Ангус вважає, що процес штучного інтелекту в мистецтві принципово не відрізняється від того, як художники-люди черпають натхнення з робіт інших художників. ШІ знає, як виглядають речі, і запам’ятовує фрагменти зображень, як і люди. Просто краще відтворити їх з нуля.

Детальніше:

відмова

Відповідно до Правила проекту Trust, будь ласка, зверніть увагу, що інформація, надана на цій сторінці, не призначена і не повинна тлумачитися як юридична, податкова, інвестиційна, фінансова або будь-яка інша форма консультації. Важливо інвестувати лише те, що ви можете дозволити собі втратити, і звернутися за незалежною фінансовою порадою, якщо у вас виникнуть сумніви. Щоб отримати додаткову інформацію, ми пропонуємо звернутися до положень та умов, а також до сторінок довідки та підтримки, наданих емітентом або рекламодавцем. MetaversePost прагне до точного, неупередженого звітування, але ринкові умови можуть змінюватися без попередження.

про автора

Агне — журналістка, яка висвітлює останні тенденції та події в метавсесвіті, ШІ та Web3 промисловості для Metaverse Post. Її пристрасть до оповідання привела її до численних інтерв’ю з експертами в цих галузях, завжди прагнучи розкрити захоплюючі та привабливі історії. Агне має ступінь бакалавра літератури та має великий досвід написання текстів на різноманітні теми, включаючи подорожі, мистецтво та культуру. Вона також була волонтером редактора організації з прав тварин, де допомагала підвищувати обізнаність про проблеми добробуту тварин. Зв'яжіться з нею [захищено електронною поштою].

інші статті
Агне Цимерман
Агне Цимерман

Агне — журналістка, яка висвітлює останні тенденції та події в метавсесвіті, ШІ та Web3 промисловості для Metaverse Post. Її пристрасть до оповідання привела її до численних інтерв’ю з експертами в цих галузях, завжди прагнучи розкрити захоплюючі та привабливі історії. Агне має ступінь бакалавра літератури та має великий досвід написання текстів на різноманітні теми, включаючи подорожі, мистецтво та культуру. Вона також була волонтером редактора організації з прав тварин, де допомагала підвищувати обізнаність про проблеми добробуту тварин. Зв'яжіться з нею [захищено електронною поштою].

Hot Stories
Приєднуйтеся до нашої розсилки.
Останні новини

Інституційний апетит зростає до біткойн ETF на тлі волатильності

Розкриття інформації через документи 13F свідчить про те, що відомі інституційні інвестори займаються біткойн ETF, підкреслюючи зростаюче визнання ...

Дізнайтеся більше

Настав день винесення вироку: суд США розглядає прохання Міністерства юстиції щодо долі CZ.

Changpeng Zhao готовий зіткнутися з вироком у американському суді в Сіетлі сьогодні.

Дізнайтеся більше
Приєднуйтесь до нашої спільноти інноваційних технологій
Детальніше
Читати далі
Injective об’єднує зусилля з AltLayer, щоб перенести безпеку в inEVM
Business Звіт про новини Технологія
Injective об’єднує зусилля з AltLayer, щоб перенести безпеку в inEVM
Травень 3, 2024
Masa об’єднується з Teller, щоб представити MASA Lending Pool, що дає можливість USDC запозичувати на базі
ринки Звіт про новини Технологія
Masa об’єднується з Teller, щоб представити MASA Lending Pool, що дає можливість USDC запозичувати на базі
Травень 3, 2024
Найближчими тижнями Velodrome запускає бета-версію Superchain і розповсюджується на блокчейни рівня 2 OP Stack
ринки Звіт про новини Технологія
Найближчими тижнями Velodrome запускає бета-версію Superchain і розповсюджується на блокчейни рівня 2 OP Stack
Травень 3, 2024
CARV оголошує про партнерство з Aethir для децентралізації рівня даних і розподілу винагород
Business Звіт про новини Технологія
CARV оголошує про партнерство з Aethir для децентралізації рівня даних і розподілу винагород
Травень 3, 2024
CRYPTOMERIA LABS PTE. LTD.