Google introdujo un modelo de IA para ilustrar artículos de noticias
En Resumen
Google anuncia un nuevo modelo de inteligencia artificial para producir resúmenes visuales de artículos de noticias de alta calidad
Google tiene anunció un nuevo modelo de inteligencia artificial (IA) que dice que puede generar automáticamente resúmenes visuales "coherentes y fluidos" de artículos de noticias. El gigante de la tecnología dice que el modelo puede ayudar a que la información sea más accesible para los usuarios al la generación de resúmenes visuales de "alta calidad" de textos extensos.
El modelo se basa en un algoritmo de aprendizaje profundo conocido como transformador, que está diseñado para "comprender" el contexto de una oración y luego generar una ilustración que conserva la información importante del texto original.
Google lleva a cabo la tarea mucho más difícil de comprender el contexto general de todo el texto, en contraste con la actualmente popular texto a imagen sistemas, que se basan en una representación "frontal" del principio "lo que veo, dibujo". Además, la elección de las imágenes se hace para crear una "imagen como un todo" en lugar de declaraciones y frases individuales (como prácticamente todo el mundo está haciendo en este momento). En otras palabras, las imágenes se eligen para todo el artículo teniendo en cuenta los contextos y los significados.
Google dice que el modelo puede generar resúmenes de múltiples oraciones de un artículo de noticias y que ha sido entrenado en un gran conjunto de datos NewsStories, que contiene casi 31 millones de artículos, 22 millones de fotografías y 1 millón de videos escondidos en los arbustos.
El primer paso es hacer coincidir la imagen con el artículo completo después de que se haya traducido a las representaciones adecuadas utilizando tanto el lenguaje como los codificadores de imágenes.
El segundo paso implica dividir un artículo de texto en oraciones separadas y codificar cada oración en una representación diferente. El objetivo es optimizar la información mutua, defidefinido en términos de distribuciones de probabilidad, entre secuencias de imágenes y texto. Como resultado se obtuvo la mayor precisión.
En conclusión, este estudio hace una variedad de contribuciones, desde aplicaciones como la ilustración narrativa automatizada hasta la desafiante tarea de unir una historia y una colección de ilustraciones. La empresa dice que modelo también se puede aplicar a otros idiomas y que está trabajando para expandir el conjunto de datos para incluir artículos de otros sitios.
Leer más artículos relacionados:
Observación
En línea con la Directrices del Proyecto Confianza, tenga en cuenta que la información proporcionada en esta página no pretende ser ni debe interpretarse como asesoramiento legal, fiscal, de inversión, financiero o de cualquier otro tipo. Es importante invertir sólo lo que pueda permitirse perder y buscar asesoramiento financiero independiente si tiene alguna duda. Para mayor información sugerimos consultar los términos y condiciones así como las páginas de ayuda y soporte proporcionadas por el emisor o anunciante. MetaversePost se compromete a brindar informes precisos e imparciales, pero las condiciones del mercado están sujetas a cambios sin previo aviso.
Sobre el Autor
Damir es el líder del equipo, gerente de producto y editor en Metaverse Post, que cubre temas como AI/ML, AGI, LLM, Metaverse y Web3-campos relacionados. Sus artículos atraen una audiencia masiva de más de un millón de usuarios cada mes. Parece ser un experto con 10 años de experiencia en SEO y marketing digital. Damir ha sido mencionado en Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto y otras publicaciones. Viaja entre los Emiratos Árabes Unidos, Turquía, Rusia y la CEI como nómada digital. Damir obtuvo una licenciatura en física, que él cree que le ha dado las habilidades de pensamiento crítico necesarias para tener éxito en el panorama siempre cambiante de Internet.
Más artículosDamir es el líder del equipo, gerente de producto y editor en Metaverse Post, que cubre temas como AI/ML, AGI, LLM, Metaverse y Web3-campos relacionados. Sus artículos atraen una audiencia masiva de más de un millón de usuarios cada mes. Parece ser un experto con 10 años de experiencia en SEO y marketing digital. Damir ha sido mencionado en Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto y otras publicaciones. Viaja entre los Emiratos Árabes Unidos, Turquía, Rusia y la CEI como nómada digital. Damir obtuvo una licenciatura en física, que él cree que le ha dado las habilidades de pensamiento crítico necesarias para tener éxito en el panorama siempre cambiante de Internet.