Entrevista Art SMW
Pot 01, 2023

DeepFloyd i més enllà: explorant les últimes novetats en art d'IA amb el CEO de NightCafe Studio

En breu

Durant una entrevista exclusiva, el CEO de NightCafe Studio va oferir valuoses idees i perspectives sobre l'art generat per IA.

Angus Russell va presentar DeepFloyd, un nou algorisme desenvolupat pel soci de NightCafe Studio, Stability AI, que opera a l'espai de píxels i utilitza un model de llenguatge gran (LLM) per generar imatges.

Estudi NightCafe és un generador d'art d'IA que permet als usuaris crear art impressionant i futurista en qüestió de segons amb l'ajuda de la intel·ligència artificial. Fundat per Angus Russell Fa quatre anys, NightCafe Studio va néixer de la pròpia frustració d'Angus de no poder trobar peces d'art que li ressonessin. Impulsat pel coneixement que existien els algorismes de transferència d'estil, va buscar un lloc web que li permetés crear art personalitzat mitjançant la transferència d'estil i imprimir-lo. 

Per a la seva decepció, no va trobar una plataforma així. Tanmateix, aquest contratemps va provocar en ell una idea innovadora. Va decidir crear una aplicació de transferència d'estil neuronal per crear art generat per IA i la va publicar a Reddit.

NightCafe Studio es va originar com una plataforma de generació de text a imatge, convertint-se en la primera d'aquest tipus. Aquesta característica única va provocar un augment significatiu tant dels ingressos com de la base d'usuaris. Des de llavors, la plataforma s'ha mantingut a l'avantguarda de la IA generativa, atraient una gran comunitat d'entusiastes que es delecten a utilitzar el generador per crear obres d'art impressionants. Avui en dia, NightCafe Studio és àmpliament considerat com un dels generadors d'imatges d'IA més populars i innovadors disponibles.

Durant una entrevista amb Angus Russell, vam explorar els beneficis i les limitacions de l'art generat per IA, l'ús creixent de la intel·ligència artificial al món de l'art i l'últim algorisme de generació d'imatges d'IA, DeepFloyd.

estudi de cafè nocturn
Sydney Opera House: una de les primeres imatges d'Angus generades amb IA

L'aparició de l'art generat per la IA

En l'última dècada, la indústria de l'art ha estat testimoni d'una infiltració gradual de la IA i l'aprenentatge automàtic (ML). Aquestes tecnologies d'avantguarda han introduït alguns conceptes nous fascinants, com ara Deepfakes i LLOSA, que han guanyat una atenció important a tot el món. Avui dia, la indústria de l'art no es pot permetre el luxe d'ignorar l'immens impacte de la IA, que ara està provocant una revolució que fa temps que s'espera en el sector.

Angus va parlar de com NightCafe Studio va experimentar pics de creixement durant el llançament de Stable Diffusion, un model de text a imatge amb el qual la seva empresa va entrar en funcionament el dia del llançament. Des d'aleshores, la barrera d'entrada per a la creació d'eines similars s'ha reduït a causa de l'open-sourcing d'algoritmes i codis de mostra.

El fundador de NightCafe Studio creu que la creació d'art d'IA no es tracta només del producte final, sinó també del procés de creació. Ho veu com una forma de teràpia i relaxació, que permet a les persones expressar-se de maneres úniques i creatives. Moltes persones que mai s'havien considerat creatives han descobert les seves habilitats artístiques a través d'imatges generades per IA. Aquesta filosofia es reflecteix a la interfície d'usuari de la plataforma, que està dissenyada per ser fàcil d'utilitzar i accessible per a artistes de tots els nivells d'habilitat. 

Només a NightCafe Studio, ja hi ha entre dos i tres milions d'usuaris al mes, generant al voltant d'un milió d'imatges al dia. Stability AI, una empresa d'IA generativa de codi obert, declarar que tenien més de 10 milions d'usuaris que estaven actius diàriament poc després del llançament de Stable Diffusion.

Recomanat: Els 10 millors generadors d'art d'IA del 2023: Midjourney, DALL-E, NightCafe, Artbreeder

DeepFloyd IF: el nou algorisme de generació d'imatges d'IA que canvia el joc

NightCafe Studio està implementant un nou algorisme per Stability AI anomenat DeepFloyd, que promet revolucionar la manera com generem imatges amb intel·ligència artificial.

DeepFloyd, que actualment es troba en fase beta, és un nou model de text a imatge que pot generar imatges impressionants a partir de descripcions en llenguatge natural. Es basa en una arquitectura novedosa que combina un gran model de llenguatge amb tres models de difusió. Està inspirat en Imagen, un model similar desenvolupat per Google Research però mai llançat al públic.

El model pot generar imatges clares i coherents amb text i objectes en diverses relacions espacials, cosa que és una tasca difícil per a la majoria dels altres models de text a imatge. Això s'aconsegueix utilitzant el gran model d'idioma T5-XXL-1.1 com a codificador de text i una quantitat important de capes d'atenció creuada de text i imatge que proporcionen una millor aliança d'imatge i indicació. 

DeepFloyd també pot crear imatges amb una relació d'aspecte no estàndard i té un alt grau de fotorealisme. A més, permet traduccions d'imatge a imatge sense captura, la qual cosa significa que l'estil, els patrons i els detalls d'una imatge de sortida es poden modificar tot mantenint la forma bàsica de la imatge d'origen sense necessitat d'ajustar-los.

El nou algorisme funciona d'una manera diferent a Stable Diffusion. DeepFloyd utilitza espai de píxels i un model de llenguatge gran (LLM), mentre que Stable Diffusion utilitza espai latent i un model CLIP fix. DeepFloyd també utilitza diversos processos de difusió per crear imatges Stable Diffusion només n'utilitza un.

DeepFloyd és el nom del grup de recerca que va crear l'algoritme, i l'algorisme en si s'anomena IF. El grup de recerca inclou moltes de les mateixes persones que van crear GPT-3el predecessor de, GPT-2, i un model de llenguatge d'última generació anterior anomenat RuGPT.

Algunes especulacions suggereixen que el nom IF pot estar inspirat en una cançó de Pink Floyd del mateix nom, tal com suggereix la biografia de les xarxes socials del grup de recerca d'algoritmes.

Llegeix més sobre l'algorisme aquí.

Deepfloyd Nightcafe Studio
Imatges generades amb DeepFloyd IF. Font: Stability AI

Comparant les limitacions de l'art d'IA i l'art digital

Una de les principals limitacions de la IA és el text, tot i que DeepFloyd aborda aquest problema. Una altra limitació és la dificultat d'aconseguir una imatge exactament tal com s'havia previst, sobretot sense la petició d'experts. La IA també no té la capacitat d'entendre i interpretar contextos culturals i socials que configuren l'art humà. Per tant, l'art generat per IA de vegades pot produir obres que semblen fora de lloc o culturalment insensibles.

Tanmateix, les imatges generades per IA encara poden ser boniques i de vegades fins i tot millors que la idea original, sempre que l'usuari estigui obert a ser sorprès, va dir Angus. A més, hi ha maneres de modificar el imatges generades mitjançant algorismes d'IA o Photoshop. Tot i que l'obtenció d'una imatge exacta és actualment una àrea d'investigació activa, s'estan fent progressos importants. Aviat serà possible tenir un control total sobre tots els aspectes d'una imatge. 

La IA es basa en les imatges i l'art que existeixen a la xarxa com a inspiració, però només en aquells en què s'ha entrenat. Diferents algorismes, com ara Midjourney, DALL-E i Stable Diffusion, estan entrenats en diferents conjunts de dades, la qual cosa significa que poden tenir un millor rendiment en tipus específics d'imatges. 

Recentment, els investigadors han estat investigant l'impacte de l'eliminació d'imatges de baixa qualitat dels conjunts de dades d'entrenament per millorar els resultats d'IA. En filtrar aquestes imatges de baixa qualitat, el conjunt de dades resultant pot ser més petit però de major qualitat, donant lloc a millors resultats sense augmentar la mida dels models d'IA o requerir maquinari més car. Angus va compartir que aquest enfocament representa una manera prometedora de millorar la qualitat de les imatges generades per IA sense dependre de models més grans i que consumeixen més recursos.

Un problema amb la IA en l'art és que pot devaluar el treball dels artistes humans, que dediquen molt de temps a crear art, mentre que la IA és capaç de generar art en qüestió de segons. Tanmateix, hi ha una certa qualitat intangible de l'art humà que pot ser difícil de replicar per a la IA, com ara la profunditat emocional i la complexitat que sovint presenten les obres creades per humans. NightCafe Studio creu que la IA es tracta menys de crear art amb finalitats comercials i més de gaudir del propi procés creatiu.

"Sempre hi haurà valor en l'art fet per humans perquè representa l'esforç i l'habilitat de l'artista, mentre que l'art generat per IA no té el mateix valor intrínsec".

Va dir Angus.

Un problema ètic que envolta la IA en l'art és l'ús de la imatge pública per entrenar algorismes d'IA que potser no pertanyen a l'empresa que entrena la IA. Tot i que actualment no hi ha cap llei trencada, planteja preguntes sobre el consentiment i la privadesa. Empreses de codi obert com OpenAI i DALL-E estan treballant per fer que el procés sigui més ètic, però segueix sent una qüestió oberta. Pot haver-hi futures normatives pel que fa a l'ús d'imatges per formar la IA en l'art.

Malgrat aquestes preocupacions, Angus creu que el procés d'IA en l'art no és fonamentalment diferent dels artistes humans que s'inspiren en el treball d'altres artistes. La IA sap com són les coses i recorda fragments de les imatges, igual que ho fan els humans. Simplement, és millor recrear-los des de zero.

Llegir més:

renúncia

En línia amb la Directrius del projecte Trust, si us plau, tingueu en compte que la informació proporcionada en aquesta pàgina no pretén ni s'ha d'interpretar com a assessorament legal, fiscal, d'inversió, financer o de cap altra forma. És important invertir només el que et pots permetre perdre i buscar assessorament financer independent si tens dubtes. Per obtenir més informació, us suggerim que feu referència als termes i condicions, així com a les pàgines d'ajuda i assistència proporcionades per l'emissor o l'anunciant. MetaversePost es compromet a fer informes precisos i imparcials, però les condicions del mercat estan subjectes a canvis sense previ avís.

About The Autor

L'Agne és una periodista que cobreix les últimes tendències i desenvolupaments en el metavers, IA i Web3 indústries per a Metaverse Post. La seva passió per la narració l'ha portat a realitzar nombroses entrevistes amb experts en aquests camps, sempre buscant descobrir històries apassionants i atractives. L'Agne és llicenciada en literatura i té una àmplia experiència en l'escriptura sobre una àmplia gamma de temes, com ara viatges, art i cultura. També ha estat voluntaria com a editora de l'organització dels drets dels animals, on va ajudar a conscienciar sobre els problemes de benestar animal. Contacta amb ella [protegit per correu electrònic].

més articles
Agne Cimerman
Agne Cimerman

L'Agne és una periodista que cobreix les últimes tendències i desenvolupaments en el metavers, IA i Web3 indústries per a Metaverse Post. La seva passió per la narració l'ha portat a realitzar nombroses entrevistes amb experts en aquests camps, sempre buscant descobrir històries apassionants i atractives. L'Agne és llicenciada en literatura i té una àmplia experiència en l'escriptura sobre una àmplia gamma de temes, com ara viatges, art i cultura. També ha estat voluntaria com a editora de l'organització dels drets dels animals, on va ajudar a conscienciar sobre els problemes de benestar animal. Contacta amb ella [protegit per correu electrònic].

L'apetit institucional creix cap als ETF de Bitcoin enmig de la volatilitat

Les divulgacions a través de les presentacions 13F revelen inversors institucionals notables que s'estan incursionant en els ETF de Bitcoin, subratllant una acceptació creixent de...

saber Més

Arriba el dia de la sentència: el destí de CZ està en equilibri mentre el tribunal nord-americà considera la petició del DOJ

Changpeng Zhao està a punt d'enfrontar-se avui a la sentència en un tribunal dels Estats Units a Seattle.

saber Més
Uneix-te a la nostra comunitat tecnològica innovadora
Més...
Llegeix més
Injective uneix forces amb AltLayer per aportar seguretat de restauració a inEVM
Negocis Informe de notícies Tecnologia
Injective uneix forces amb AltLayer per aportar seguretat de restauració a inEVM
Pot 3, 2024
Masa s'uneix amb Teller per presentar el grup de préstecs MASA, que permet l'endeutament de l'USDC a la base
mercats Informe de notícies Tecnologia
Masa s'uneix amb Teller per presentar el grup de préstecs MASA, que permet l'endeutament de l'USDC a la base
Pot 3, 2024
Velodrome llança la versió beta de Superchain en les properes setmanes i s'expandeix a les cadenes de blocs de la capa 2 de la pila OP
mercats Informe de notícies Tecnologia
Velodrome llança la versió beta de Superchain en les properes setmanes i s'expandeix a les cadenes de blocs de la capa 2 de la pila OP
Pot 3, 2024
CARV anuncia associació amb Aethir per descentralitzar la seva capa de dades i distribuir recompenses
Negocis Informe de notícies Tecnologia
CARV anuncia associació amb Aethir per descentralitzar la seva capa de dades i distribuir recompenses
Pot 3, 2024
CRYPTOMERIA LABS PTE. LTD.