Entrevista Arte SMW
01 de mayo de 2023

DeepFloyd y más allá: explorando lo último en arte de IA con el CEO de NightCafe Studio

En Resumen

Durante una entrevista exclusiva, el director ejecutivo de NightCafe Studio brindó información y perspectivas valiosas sobre el arte generado por IA.

Angus Russell presentó DeepFloyd, un nuevo algoritmo desarrollado por el socio de NightCafe Studio, Stability AI, que opera en el espacio de píxeles y utiliza un modelo de lenguaje grande (LLM) para generar imágenes.

Estudio NightCafe es un generador de arte AI que permite a los usuarios crear arte impresionante y futurista en segundos con la ayuda de la inteligencia artificial. Fundado por angus russell Hace cuatro años, NightCafe Studio nació de la propia frustración de Angus por no poder encontrar piezas de arte que resonaran con él. Impulsado por el conocimiento de que existían algoritmos de transferencia de estilo, buscó un sitio web que le permitiera crear arte personalizado a través de la transferencia de estilo e imprimirlo. 

Para su decepción, no pudo encontrar tal plataforma. Sin embargo, este revés despertó en él una idea innovadora. Decidió crear una aplicación de transferencia de estilo neuronal para crear arte generado por IA y la subió a Reddit.

NightCafe Studio se originó como una plataforma de generación de texto a imagen, lo que la convierte en la primera de su tipo. Esta característica única provocó un aumento significativo tanto en los ingresos como en la base de usuarios. Desde entonces, la plataforma se ha mantenido a la vanguardia de la IA generativa, atrayendo a una gran comunidad de entusiastas que disfrutan usando el generador para crear impresionantes obras de arte. Hoy en día, NightCafe Studio es ampliamente considerado como uno de los generadores de imágenes de IA más populares e innovadores disponibles.

Durante una entrevista con Angus Russell, exploramos los beneficios y las limitaciones del arte generado por IA, el uso cada vez mayor de la inteligencia artificial en el mundo del arte y el último algoritmo de generación de imágenes de IA, DeepFloyd.

estudio de café nocturno
Sydney Opera House: una de las primeras imágenes generadas por IA de Angus

El surgimiento del arte generado por IA

En la última década, la industria del arte ha sido testigo de una infiltración gradual de la IA y el aprendizaje automático (ML). Estas tecnologías de vanguardia han introducido algunos conceptos nuevos fascinantes, como Deepfakes y DALL-E, que han ganado una atención significativa en todo el mundo. Hoy en día, la industria del arte no puede darse el lujo de ignorar el inmenso impacto de la IA, que ahora está desencadenando una revolución en el sector que se esperaba desde hace mucho tiempo.

Angus habló sobre cómo NightCafe Studio experimentó picos de crecimiento durante el lanzamiento de Stable Diffusion, un modelo de texto a imagen que su empresa puso en marcha el día del lanzamiento. Desde entonces, la barrera de entrada para crear herramientas similares se ha reducido debido a la fuente abierta de algoritmos y códigos de muestra.

El fundador de NightCafe Studio cree que crear arte con IA no se trata solo del producto final, sino también del proceso de creación. Lo ve como una forma de terapia y relajación, que permite a las personas expresarse de maneras únicas y creativas. Muchas personas que nunca se habían considerado creativas han descubierto sus habilidades artísticas a través de imágenes generadas por IA. Esta filosofía se refleja en la interfaz de usuario de la plataforma, que está diseñada para ser fácil de usar y accesible para artistas de todos los niveles. 

Solo en NightCafe Studio, ya hay entre dos y tres millones de usuarios por mes, generando alrededor de un millón de imágenes por día. Stability AI, una empresa de IA generativa de código abierto, dijo que tenían más de 10 millones de usuarios que estaban activos diariamente poco después del lanzamiento de Stable Diffusion.

Recomendado: Más de 10 mejores generadores de arte de IA de 2023: Midjourney, DALL-E, Café Nocturno, Artbreeder

DeepFloyd IF: el nuevo algoritmo innovador de generación de imágenes de IA

NightCafe Studio está implementando un nuevo algoritmo por Stability AI , que son floydprofundo, que promete revolucionar la forma en que generamos imágenes con inteligencia artificial.

DeepFloyd, que actualmente se encuentra en versión beta, es un nuevo modelo de texto a imagen que puede generar imágenes impresionantes a partir de descripciones en lenguaje natural. Se basa en una arquitectura novedosa que combina un modelo de lenguaje grande con tres modelos de difusión. Está inspirado en Imagen, un modelo similar desarrollado por Google Research pero que nunca se lanzó al público.

El modelo puede generar imágenes claras y coherentes con texto y objetos en varias relaciones espaciales, lo cual es una tarea desafiante para la mayoría de los otros modelos de texto a imagen. Esto se logra utilizando el modelo de lenguaje grande T5-XXL-1.1 como codificador de texto y una cantidad significativa de capas de atención cruzada de texto e imagen que brindan una mejor alianza de imágenes y mensajes. 

DeepFloyd también puede crear imágenes con una relación de aspecto no estándar y tiene un alto grado de fotorrealismo. Además, permite traducciones de imagen a imagen sin disparo, lo que significa que el estilo, los patrones y los detalles de una imagen de salida se pueden modificar manteniendo la forma básica de la imagen de origen sin necesidad de ajustes.

El nuevo algoritmo opera de una manera diferente a Stable Diffusion. DeepFloyd usa espacio de píxeles y un modelo de lenguaje grande (LLM), mientras que Stable Diffusion utiliza espacio latente y un modelo CLIP fijo. DeepFloyd también utiliza múltiples procesos de difusión para crear imágenes, mientras que Stable Diffusion solo usa uno.

DeepFloyd es el nombre del grupo de investigación que creó el algoritmo, y el algoritmo en sí se llama IF. El grupo de investigación incluye muchas de las mismas personas que crearon GPT-3el antecesor de , GPT-2, y un modelo de lenguaje de última generación anterior llamado RuGPT.

Algunas especulaciones sugieren que el nombre IF puede estar inspirado en una canción de Pink Floyd del mismo nombre, como se insinúa en las biografías de las redes sociales del grupo de investigación de algoritmos.

Leer más sobre el algoritmo esta página.

estudio deepfloyd nightcafé
Imágenes generadas con DeepFloyd IF. Fuente: Stability AI

Comparación de las limitaciones del arte de la IA y el arte digital

Una de las principales limitaciones de la IA es el texto, aunque DeepFloyd aborda este problema. Otra limitación es la dificultad de obtener una imagen exactamente como se esperaba, especialmente sin el asesoramiento de un experto. La IA también carece de la capacidad de comprender e interpretar el Contextos culturales y sociales que dan forma al arte humano.. Por lo tanto, el arte generado por IA a veces puede producir obras que parecen fuera de lugar o culturalmente insensibles.

Sin embargo, las imágenes generadas por IA aún pueden ser hermosas y, en ocasiones, incluso mejores que la idea original, siempre y cuando el usuario esté abierto a la sorpresa, dijo Angus. Además, existen formas de modificar el imágenes generadas utilizando algoritmos de IA o Photoshop. Si bien obtener una imagen exacta es actualmente un área de investigación activa, se están logrando avances significativos. Quizás pronto sea posible tener control total sobre cada aspecto de una imagen. 

AI se basa en las imágenes y el arte que existen en la web como inspiración, pero solo en aquellos en los que se entrenó. Diferentes algoritmos, como Midjourney, DALL-E, y Stable Diffusion, están entrenados en diferentes conjuntos de datos, lo que significa que pueden funcionar mejor en tipos específicos de imágenes. 

Recientemente, los investigadores han estado investigando el impacto de eliminar imágenes de baja calidad de los conjuntos de datos de entrenamiento para mejorar los resultados de la IA. Al filtrar estas imágenes de baja calidad, el conjunto de datos resultante puede volverse más pequeño pero de mayor calidad, lo que genera mejores resultados sin aumentar el tamaño de los modelos de IA ni requerir un hardware más costoso. Angus compartió que este enfoque representa una forma prometedora de mejorar la calidad de las imágenes generadas por IA sin depender de modelos más grandes y que consumen más recursos.

Un problema con la IA en el arte es que puede devaluar el trabajo de los artistas humanos, que pasan mucho tiempo creando arte, mientras que la IA puede generar arte en cuestión de segundos. Sin embargo, hay una cierta cualidad intangible en el arte humano que puede ser difícil de replicar para la IA, como la profundidad emocional y la complejidad que a menudo están presentes en las obras creadas por humanos. NightCafe Studio cree que la IA tiene menos que ver con la creación de arte con fines comerciales y más con el disfrute del proceso creativo en sí.

“Siempre habrá valor en el arte hecho por humanos porque representa el esfuerzo y la habilidad del artista, mientras que el arte generado por IA no tiene el mismo valor intrínseco”.

Dijo Angus.

Un problema ético que rodea a la IA en el arte es el uso de imágenes públicas para entrenar algoritmos de IA que pueden no pertenecer a la empresa que entrena la IA. Si bien actualmente no se han violado leyes, plantea dudas sobre el consentimiento y la privacidad. Empresas de código abierto como OpenAI y DALL-E están trabajando para hacer que el proceso sea más ético, pero sigue siendo una pregunta abierta. Puede haber futuras regulaciones con respecto al uso de imágenes para entrenar a la IA en el arte.

A pesar de estas preocupaciones, Angus cree que el proceso de la IA en el arte no es fundamentalmente diferente de los artistas humanos que se inspiran en el trabajo de otros artistas. AI sabe cómo se ven las cosas y recuerda partes de las imágenes, al igual que los humanos. Simplemente es mejor recrearlos desde cero.

Más información:

Observación

En línea con la Directrices del Proyecto Confianza, tenga en cuenta que la información proporcionada en esta página no pretende ser ni debe interpretarse como asesoramiento legal, fiscal, de inversión, financiero o de cualquier otro tipo. Es importante invertir sólo lo que pueda permitirse perder y buscar asesoramiento financiero independiente si tiene alguna duda. Para mayor información sugerimos consultar los términos y condiciones así como las páginas de ayuda y soporte proporcionadas por el emisor o anunciante. MetaversePost se compromete a brindar informes precisos e imparciales, pero las condiciones del mercado están sujetas a cambios sin previo aviso.

Sobre el Autor

Agne es una periodista que cubre las últimas tendencias y desarrollos en metaverso, IA y Web3 industrias para la Metaverse Post. Su pasión por contar historias la ha llevado a realizar numerosas entrevistas con expertos en estos campos, buscando siempre descubrir historias apasionantes y atrapantes. Agne tiene una licenciatura en literatura y tiene una amplia experiencia escribiendo sobre una amplia gama de temas, incluidos viajes, arte y cultura. También se ofreció como editora voluntaria de la organización de derechos de los animales, donde ayudó a crear conciencia sobre cuestiones de bienestar animal. Contáctala en [email protected].

Más artículos
Agne Cimerman
Agne Cimerman

Agne es una periodista que cubre las últimas tendencias y desarrollos en metaverso, IA y Web3 industrias para la Metaverse Post. Su pasión por contar historias la ha llevado a realizar numerosas entrevistas con expertos en estos campos, buscando siempre descubrir historias apasionantes y atrapantes. Agne tiene una licenciatura en literatura y tiene una amplia experiencia escribiendo sobre una amplia gama de temas, incluidos viajes, arte y cultura. También se ofreció como editora voluntaria de la organización de derechos de los animales, donde ayudó a crear conciencia sobre cuestiones de bienestar animal. Contáctala en [email protected].

Crece el apetito institucional por los ETF de Bitcoin en medio de la volatilidad

Las divulgaciones a través de presentaciones 13F revelan que notables inversores institucionales incursionan en los ETF de Bitcoin, lo que subraya una creciente aceptación de...

Para saber más

Llega el día de la sentencia: el destino de CZ pende de un hilo mientras un tribunal de EE. UU. considera la petición del Departamento de Justicia

Changpeng Zhao está listo para enfrentar hoy su sentencia en un tribunal estadounidense en Seattle.

Para saber más
Únase a nuestra comunidad tecnológica innovadora
Leer Más
Leer más
Injective une fuerzas con AltLayer para llevar la seguridad de recuperación a inEVM
Empresa Informe de noticias Tecnología
Injective une fuerzas con AltLayer para llevar la seguridad de recuperación a inEVM
3 de mayo de 2024
Masa se asocia con Teller para presentar el fondo de préstamos MASA y permite pedir prestado al USDC en base
Industrias Informe de noticias Tecnología
Masa se asocia con Teller para presentar el fondo de préstamos MASA y permite pedir prestado al USDC en base
3 de mayo de 2024
Velodrome lanza la versión Beta de Superchain en las próximas semanas y se expande a través de las cadenas de bloques OP Stack Layer 2
Industrias Informe de noticias Tecnología
Velodrome lanza la versión Beta de Superchain en las próximas semanas y se expande a través de las cadenas de bloques OP Stack Layer 2
3 de mayo de 2024
CARV anuncia asociación con Aethir para descentralizar su capa de datos y distribuir recompensas
Empresa Informe de noticias Tecnología
CARV anuncia asociación con Aethir para descentralizar su capa de datos y distribuir recompensas
3 de mayo de 2024
CRYPTOMERIA LABORATORIOS PTE. LIMITADO.