Интервью Искусство СМЗ
01 мая 2023

DeepFloyd и не только: изучаем новейшее искусство искусственного интеллекта с генеральным директором NightCafe Studio

Коротко

Во время эксклюзивного интервью генеральный директор NightCafe Studio поделился ценными мыслями и взглядами на искусство, созданное искусственным интеллектом.

Ангус Рассел представил DeepFloyd — новый алгоритм, разработанный партнером NightCafe Studio, Stability AI, который работает в пространстве пикселей и использует модель большого языка (LLM) для создания изображений.

Ночное кафе-студия — это генератор искусств на основе искусственного интеллекта, который позволяет пользователям создавать потрясающие и футуристические произведения искусства за считанные секунды с помощью искусственного интеллекта. Основан Ангус Рассел Четыре года назад NightCafe Studio родилась из-за собственного разочарования Ангуса из-за того, что он не смог найти произведения искусства, которые находили бы отклик у него. Руководствуясь знаниями о существовании алгоритмов передачи стиля, он искал веб-сайт, который позволил бы ему создавать персонализированные произведения искусства посредством передачи стиля и печатать их. 

К его разочарованию, он не смог найти такую ​​платформу. Однако эта неудача зажгла в нем новаторскую идею. Он решил создать приложение для переноса нейронного стиля для создания искусства, созданного искусственным интеллектом, и разместил его на Reddit.

NightCafe Studio возникла как платформа для преобразования текста в изображение, что делает ее первой в своем роде. Эта уникальная функция привела к значительному увеличению как доходов, так и пользовательской базы. С тех пор платформа остается в авангарде генеративного ИИ, привлекая большое сообщество энтузиастов, которым нравится использовать генератор для создания потрясающих произведений искусства. Сегодня NightCafe Studio широко известен как один из самых популярных и инновационных генераторов изображений с искусственным интеллектом.

Во время интервью с Ангусом Расселом мы рассмотрели преимущества и ограничения искусства, созданного с помощью ИИ, растущее использование искусственного интеллекта в мире искусства и новейший алгоритм создания изображений с помощью ИИ — DeepFloyd.

студия ночного кафе
Сиднейский оперный театр: одно из первых изображений Ангуса, созданных искусственным интеллектом

Появление искусства, созданного искусственным интеллектом

В последнее десятилетие художественная индустрия стала свидетелем постепенного проникновения ИИ и машинного обучения (МО). Эти передовые технологии представили несколько интересных новых концепций, таких как Deepfakes и DALL-E, которые получили значительное внимание во всем мире. Сегодня арт-индустрия не может позволить себе игнорировать огромное влияние ИИ, который вызывает давно назревшую революцию в этом секторе.

Ангус рассказал о резком росте NightCafe Studio во время выпуска Stable Diffusion, модель преобразования текста в изображение, которую его компания запустила в день запуска. С тех пор входной барьер для создания подобных инструментов был снижен благодаря открытому исходному коду алгоритмов и образцов кода.

Основатель NightCafe Studio считает, что создание искусственного интеллекта — это не только конечный продукт, но и процесс его создания. Он рассматривает это как форму терапии и релаксации, позволяющую людям выражать себя уникальными и творческими способами. Многие люди, которые никогда не считали себя творческими, открыли свои художественные способности благодаря изображениям, созданным искусственным интеллектом. Эта философия отражена в пользовательском интерфейсе платформы, который разработан, чтобы быть удобным и доступным для художников всех уровней квалификации. 

Только в NightCafe Studio уже насчитывается от двух до трех миллионов пользователей в месяц, генерирующих около миллиона изображений в день. Stability AI, компания с открытым исходным кодом, занимающаяся генеративным искусственным интеллектом, заявил что у них было более 10 миллионов пользователей, которые были активны ежедневно вскоре после запуска Stable Diffusion.

Рекомендуется: 10+ лучших генераторов искусств с искусственным интеллектом 2023 года: Midjourney, ДАЛЛ-И, Ночное Кафе, Артбридер

DeepFloyd IF: новый революционный алгоритм генерации изображений ИИ

NightCafe Studio реализует новый алгоритм Stability AI под названием ДипФлойд, который обещает произвести революцию в том, как мы создаем изображения с помощью искусственного интеллекта.

DeepFloyd, который в настоящее время находится в стадии бета-тестирования, представляет собой новую модель преобразования текста в изображение, которая может генерировать впечатляющие изображения из описаний на естественном языке. Он основан на новой архитектуре, сочетающей большую языковую модель с тремя моделями распространения. Он вдохновлен Imagen, аналогичной моделью, разработанной Google Research, но так и не выпущенной для широкой публики.

Модель может генерировать четкие и связные изображения с текстом и объектами в различных пространственных отношениях, что является сложной задачей для большинства других моделей преобразования текста в изображение. Это достигается с помощью большой языковой модели T5-XXL-1.1 в качестве текстового кодировщика и значительного количества уровней перекрестного внимания текст-изображение, которые обеспечивают лучшее сочетание подсказки и изображения. 

DeepFloyd также может создавать изображения с нестандартным соотношением сторон и обладает высокой степенью фотореализма. Кроме того, он позволяет выполнять преобразование изображения в изображение с нуля, что означает, что стиль, шаблоны и детали выходного изображения могут быть изменены при сохранении базовой формы исходного изображения без необходимости точной настройки.

Новый алгоритм работает иначе, чем Stable Diffusion. DeepFloyd использует пространство пикселей и модель большого языка (LLM), в то время как Stable Diffusion использует скрытое пространство и фиксированную модель CLIP. DeepFloyd также использует несколько процессов распространения для создания изображений, в то время как Stable Diffusion использует только один.

DeepFloyd — это название исследовательской группы, создавшей алгоритм, а сам алгоритм называется IF. В исследовательскую группу входят многие из тех же людей, которые создали GPT-3предшественник, GPT-2и предыдущая современная языковая модель под названием RuGPT.

Некоторые предположения предполагают, что название IF может быть вдохновлено одноименной песней Pink Floyd, на что намекает группа по исследованию алгоритмов в социальных сетях.

Подробнее об алгоритме здесь.

Студия ночного кафе Deepfloyd
Изображения, созданные с помощью DeepFloyd IF. Источник: Stability AI

Сравнение ограничений искусственного интеллекта и цифрового искусства

Одним из основных ограничений ИИ является текст, хотя DeepFloyd решает эту проблему. Еще одним ограничением является сложность получения изображения в точности так, как задумано, особенно без подсказок экспертов. ИИ также не обладает способностью понимать и интерпретировать культурный и социальный контекст, формирующий человеческое искусство. Поэтому искусство, созданное ИИ, иногда может создавать произведения, которые кажутся неуместными или культурно нечувствительными.

Тем не менее, изображения, созданные с помощью ИИ, по-прежнему могут быть красивыми, а иногда даже лучше, чем первоначальная идея, если пользователь готов удивиться, говорит Ангус. Кроме того, существуют способы изменить созданные изображения с использованием алгоритмов искусственного интеллекта или Photoshop. Хотя получение точного изображения в настоящее время является областью активных исследований, достигнут значительный прогресс. Возможно, вскоре станет возможным иметь полный контроль над каждым аспектом изображения. 

ИИ полагается на изображения и искусство, существующие в сети, в качестве вдохновения, но только на те, на которых он обучался. Различные алгоритмы, такие как Midjourney, ДАЛЛ-И и Stable Diffusion, обучаются на разных наборах данных, что означает, что они могут работать лучше на определенных типах изображений. 

В последнее время исследователи изучают влияние удаления некачественных изображений из наборов обучающих данных на улучшение результатов ИИ. Отфильтровывая эти низкокачественные изображения, результирующий набор данных может стать меньше, но более высокого качества, что приведет к лучшим результатам без увеличения размера моделей ИИ или более дорогого оборудования. Ангус поделился, что этот подход представляет собой многообещающий способ улучшить качество изображений, созданных ИИ, не полагаясь на более крупные и ресурсоемкие модели.

Одна из проблем с ИИ в искусстве заключается в том, что он может обесценить работу людей-художников, которые тратят много времени на создание искусства, в то время как ИИ способен генерировать искусство за считанные секунды. Однако у человеческого искусства есть определенное нематериальное качество, которое ИИ может быть трудно воспроизвести, например, эмоциональная глубина и сложность, часто присутствующие в работах, созданных людьми. NightCafe Studio считает, что искусственный интеллект нужен не столько для создания произведений искусства в коммерческих целях, сколько для получения удовольствия от самого творческого процесса.

«Искусство, созданное руками человека, всегда будет иметь ценность, потому что оно представляет собой усилия и мастерство художника, тогда как искусство, созданное искусственным интеллектом, не имеет такой же внутренней ценности».

- сказал Ангус.

Этическая проблема, связанная с ИИ в искусстве, заключается в использовании общедоступных изображений для обучения алгоритмов ИИ, которые могут не принадлежать компании, обучающей ИИ. Хотя в настоящее время законы не нарушены, возникают вопросы о согласии и конфиденциальности. Компании с открытым исходным кодом, такие как OpenAI и DALL-E работают над тем, чтобы сделать этот процесс более этичным, но вопрос остается открытым. В будущем могут появиться правила, касающиеся использования изображений для обучения ИИ искусству.

Несмотря на эти опасения, Ангус считает, что процесс использования ИИ в искусстве принципиально не отличается от художников-людей, черпающих вдохновение в работах других художников. ИИ знает, как выглядят вещи, и запоминает фрагменты изображений, как и люди. Просто лучше воссоздать их с нуля.

Прочитайте больше:

Отказ от ответственности

В соответствии с Руководство трастового проектаОбратите внимание, что информация, представленная на этой странице, не предназначена и не должна интерпретироваться как юридическая, налоговая, инвестиционная, финансовая или любая другая форма консультации. Важно инвестировать только то, что вы можете позволить себе потерять, и обращаться за независимой финансовой консультацией, если у вас есть какие-либо сомнения. Для получения дополнительной информации мы предлагаем обратиться к положениям и условиям, а также к страницам справки и поддержки, предоставленным эмитентом или рекламодателем. MetaversePost стремится предоставлять точную и объективную отчетность, однако рыночные условия могут быть изменены без предварительного уведомления.

Об авторе

Агне — журналист, освещающий последние тенденции и разработки в области метавселенной, искусственного интеллекта и Web3 отрасли для Metaverse Post. Ее страсть к рассказыванию историй побудила ее проводить многочисленные интервью с экспертами в этих областях, всегда стремясь раскрыть захватывающие и увлекательные истории. Агне имеет степень бакалавра литературы и имеет обширный опыт написания статей на самые разные темы, включая путешествия, искусство и культуру. Она также работала волонтером в качестве редактора организации по защите прав животных, где помогала повышать осведомленность о проблемах защиты животных. Свяжитесь с ней по [электронная почта защищена].

Другие статьи
Агне Цимерман
Агне Цимерман

Агне — журналист, освещающий последние тенденции и разработки в области метавселенной, искусственного интеллекта и Web3 отрасли для Metaverse Post. Ее страсть к рассказыванию историй побудила ее проводить многочисленные интервью с экспертами в этих областях, всегда стремясь раскрыть захватывающие и увлекательные истории. Агне имеет степень бакалавра литературы и имеет обширный опыт написания статей на самые разные темы, включая путешествия, искусство и культуру. Она также работала волонтером в качестве редактора организации по защите прав животных, где помогала повышать осведомленность о проблемах защиты животных. Свяжитесь с ней по [электронная почта защищена].

Hot Stories
Подпишитесь на нашу рассылку.
Новости

Институциональный аппетит к биткойн-ETF растет на фоне волатильности

Раскрытие информации через отчеты 13F показывает, что известные институциональные инвесторы балуются биткойн-ETF, подчеркивая растущее признание...

Узнать больше

Наступил день вынесения приговора: судьба CZ висит на волоске, поскольку суд США рассматривает ходатайство Министерства юстиции

Чанпэн Чжао сегодня предстанет перед судом США в Сиэтле.

Узнать больше
Присоединяйтесь к нашему сообществу инновационных технологий
Узнать больше
Читать далее
Injective объединяет усилия с AltLayer, чтобы внести изменения в безопасность в inEVM
Бизнес Новостной репортаж Технологии
Injective объединяет усилия с AltLayer, чтобы внести изменения в безопасность в inEVM
3 мая 2024
Masa объединяется с Teller, чтобы представить кредитный пул MASA, позволяющий заимствовать USDC на базе
Области применения: Новостной репортаж Технологии
Masa объединяется с Teller, чтобы представить кредитный пул MASA, позволяющий заимствовать USDC на базе
3 мая 2024
Velodrome запускает бета-версию Superchain в ближайшие недели и распространяется на блокчейны второго уровня стека OP
Области применения: Новостной репортаж Технологии
Velodrome запускает бета-версию Superchain в ближайшие недели и распространяется на блокчейны второго уровня стека OP
3 мая 2024
CARV объявляет о партнерстве с Aethir для децентрализации уровня данных и распределения вознаграждений
Бизнес Новостной репортаж Технологии
CARV объявляет о партнерстве с Aethir для децентрализации уровня данных и распределения вознаграждений
3 мая 2024
CRYPTOMERIA LABS PTE. ООО