AI Wiki
Marzo 06, 2023

Cómo generar una animación de transformación de imágenes con ControlNet

Debido a un experimento anterior conducird, teníamos la idea de usar ControlNet para morphing. Solo entonces cambiamos a usar el modelo depth2img, que puede crear una imagen a partir de un mapa de profundidad, en lugar de ControlNet. Y ControlNet puede funcionar no solo en profundidad. Esta entrada tiene más información sobre la técnica.

Cómo generar una animación de transformación de imágenes con ControlNet

Te daré un resumen rápido del procedimiento. La opción de fuerza de eliminación de ruido, que afecta la cantidad de pasos durante la generación, está disponible para nosotros si generamos una imagen en img2img. Por ejemplo, con pasos = 30 y fuerza de reducción de ruido = 0.5, solo quedarán 15 pasos para crear. Este razonamiento se puede aplicar a la animación del morph. Puedes transformar cualquier imagen; los retratos no son los únicos que se pueden hacer.

Toma la foto original. Active ControlNet dejando el cuadro de imagen en blanco. Elija semilla para ser -1 para generar pruebas aleatorias; el recuento de lotes influye en su cantidad. Puede experimentar con los parámetros de guía, el peso de la tarjeta recibida y el modo ControlNet. Si te gusta la generación, arrástrala con el mouse a img2img y luego repite el proceso, buscando la imagen en la que eventualmente se convertirá la segunda imagen. A medida que se completa cada imagen, surge la pregunta de cómo crear una animación. (Para comenzar, recuerde configurar el conteo de lotes en 1 para evitar crear fotos adicionales).

Utilizaremos una solución intrigante en este momento, pero hablaré sobre sus deficiencias más adelante.

Se utilizará la gráfica XYZ; debe elegirlo de la lista Script. Nos permitirá crear no solo la imagen final, sino también la transición desde la imagen de origen.

En valores X ponemos en la línea que dice:

0.0.296.0.39.0.459.0.515.0.563.0.606.0.644.0.68.0.713.0.743.0.772.0.799.0.825.0.85.0.874.0.897.0.919.0.94.0.961.

Esto significa que cuando comience la generación, recibiremos 21 imágenes en lugar de solo una (el número de valores separados por comas). ¿Por qué está esta línea allí? Por ejemplo, puede aparecer de manera diferente.

Este formato hace que sea más fácil de entender: solicita 20 imágenes del sistema automatizado y le pide que demuestre cómo la eliminación de ruido afectará el resultado para valores que van de 0 a 1. El inconveniente de la segunda opción es que da como resultado un cambio lineal en los valores. , debido a las características del ruido, no parece ser un morphing realista. Los números cercanos a cero casi no tienen efecto en el resultado. ya niveles superiores a 0.5, empieza a influir de forma muy notoria.

Como resultado, la primera línea es una curva del tipo x.4, o x elevada en 0.4. En la imagen se contrastan una función lineal recta y una función curva, que producirá una salida más precisa. Puede usar una licuadora para crear tal cadena.

Debe elegir la cantidad de cuadros para la transición antes de crear su línea. Es editable en la configuración del proyecto.

Debe realizar varios pasos para obtener una línea. Primero, experimente con la forma de la curva. Para lograr esto, seleccione "Eliminar fotogramas clave" en el menú contextual del parámetro de animación.

Aquí está la fórmula para obtener la curva; el parámetro se volvió azul, lo que indica que el controlador está operando en él.

Puede jugar con el valor aquí. 4. Pero, evite ir demasiado bajo. cuadro/21 denota un cambio de valor de 0 a 1 en el cuadro 0 al cuadro 21. Solo quedan valores entre 1 y 20 cuadros.

Sin embargo, las llaves no son el conductor. Primero deben estar preparados. Para lograr esto, haga clic en Objeto > Animación > Acción de horneado en la ventana 3D y luego haga clic en Aceptar.

Sin embargo, esto afectará a todas las claves posibles del objeto y deben eliminarse. Seleccione todo excepto la primera línea y presione X en el teclado (el mouse debe estar ubicado debajo de la lista).

Y ahora, para obtener la línea en el lado izquierdo de la pantalla, haga clic en reproducir y abra la ventana de la consola.

Tengo una cadena que se puede copiar.

Ahora, para hacer la animación, debe hacer este proceso por separado para cada posición de imagen que se hizo al principio y luego ensamblarla en animación en algún editor de video.

Sí, el proceso aún no está automatizado, pero puedes personalizar todo por ti mismo. Puede cambiar el modelo de generación y el modelo y modo de ControlNet, habilitar o deshabilitar el preproceso o cualquier otra cosa que desee. Lo principal es no perder buenos resultados y luego repetir todo correctamente para crear animación.

Desventajas de la tecnología: no debe sentar muchas bases para la transición. Escribimos anteriormente que el ruido afecta la cantidad de pasos. Puede resultar que la salida duplique las imágenes ya que varios valores de eliminación de ruido estarán dentro del mismo número de pasos. Su número se puede observar en la consola automática.

Esta tecnología se puede utilizar en conjunto con retardadores interpoladores, es decir, enviar la animación para completar los cuadros que faltan; esto dará cambios más suaves.

Fuente original

Leer más artículos relacionados:

Observación

En línea con la Directrices del Proyecto Confianza, tenga en cuenta que la información proporcionada en esta página no pretende ser ni debe interpretarse como asesoramiento legal, fiscal, de inversión, financiero o de cualquier otro tipo. Es importante invertir sólo lo que pueda permitirse perder y buscar asesoramiento financiero independiente si tiene alguna duda. Para mayor información sugerimos consultar los términos y condiciones así como las páginas de ayuda y soporte proporcionadas por el emisor o anunciante. MetaversePost se compromete a brindar informes precisos e imparciales, pero las condiciones del mercado están sujetas a cambios sin previo aviso.

Sobre el Autor

Damir es el líder del equipo, gerente de producto y editor en Metaverse Post, que cubre temas como AI/ML, AGI, LLM, Metaverse y Web3-campos relacionados. Sus artículos atraen una audiencia masiva de más de un millón de usuarios cada mes. Parece ser un experto con 10 años de experiencia en SEO y marketing digital. Damir ha sido mencionado en Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto y otras publicaciones. Viaja entre los Emiratos Árabes Unidos, Turquía, Rusia y la CEI como nómada digital. Damir obtuvo una licenciatura en física, que él cree que le ha dado las habilidades de pensamiento crítico necesarias para tener éxito en el panorama siempre cambiante de Internet. 

Más artículos
Damir Yalalov
Damir Yalalov

Damir es el líder del equipo, gerente de producto y editor en Metaverse Post, que cubre temas como AI/ML, AGI, LLM, Metaverse y Web3-campos relacionados. Sus artículos atraen una audiencia masiva de más de un millón de usuarios cada mes. Parece ser un experto con 10 años de experiencia en SEO y marketing digital. Damir ha sido mencionado en Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto y otras publicaciones. Viaja entre los Emiratos Árabes Unidos, Turquía, Rusia y la CEI como nómada digital. Damir obtuvo una licenciatura en física, que él cree que le ha dado las habilidades de pensamiento crítico necesarias para tener éxito en el panorama siempre cambiante de Internet. 

Crece el apetito institucional por los ETF de Bitcoin en medio de la volatilidad

Las divulgaciones a través de presentaciones 13F revelan que notables inversores institucionales incursionan en los ETF de Bitcoin, lo que subraya una creciente aceptación de...

Para saber más

Llega el día de la sentencia: el destino de CZ pende de un hilo mientras un tribunal de EE. UU. considera la petición del Departamento de Justicia

Changpeng Zhao está listo para enfrentar hoy su sentencia en un tribunal estadounidense en Seattle.

Para saber más
Únase a nuestra comunidad tecnológica innovadora
Leer Más
Leer más
Med-Gemini de Google está listo para dar una ventaja a GPT-4 Con su desempeño superior en atención médica
AI Wiki Noticias Software Tecnología
Med-Gemini de Google está listo para dar una ventaja a GPT-4 Con su desempeño superior en atención médica
2 de mayo de 2024
El renacimiento de la IA en el desarrollo de juegos en 2024
AI Wiki Metaverso Wiki Categoría Educación Industrias Software Tecnología
El renacimiento de la IA en el desarrollo de juegos en 2024
1 de mayo de 2024
Posibles desafíos de integrar la IA en contratos inteligentes mientras se equilibra la innovación y la seguridad
AI Wiki Seguridad Wiki Software Historias y comentarios Tecnología
Posibles desafíos de integrar la IA en contratos inteligentes mientras se equilibra la innovación y la seguridad
Abril 29, 2024
Monedas de IA que están causando sensación en el mundo de las criptomonedas: rendimiento, casos de uso y lo que sigue
AI Wiki Crypto Wiki Historias y comentarios Tecnología
Monedas de IA que están causando sensación en el mundo de las criptomonedas: rendimiento, casos de uso y lo que sigue
Abril 26, 2024
CRYPTOMERIA LABORATORIOS PTE. LIMITADO.