Informe de noticias Tecnología
Marzo 15, 2023

GPT-4 Puede manejar sus solicitudes de imágenes, documentos, diagramas y capturas de pantalla

En Resumen

GPT-4 puede manejar solicitudes de imágenes, documentos, diagramas y capturas de pantalla. Es una mejora respecto a GPT-3, que solo manejaba texto.

GPT-4 tiene un rendimiento superior en varios exámenes y pruebas y puede acceder a información y detalles adicionales a través de imágenes que pueden no estar disponibles en forma escrita.

gpt-4 imágenes documentos capturas de pantalla

OpenAIEl último hito de 's, el nuevo modelo GPT-4, puede aceptar solicitudes que incluyan imágenes, documentos con texto, diagramas o capturas de pantalla como entradas. Esto representa una mejora significativa con respecto a la versión anterior, GPT-3, que solo podía comprender y generar texto. Con esta nueva característica, GPT-4 genera salidas de texto dadas las entradas que consisten en texto e imágenes intercaladas.

“En una variedad de dominios, incluidos documentos con texto y fotografías, diagramas o capturas de pantalla,GPT-4 exhibe capacidades similares a las de las entradas de solo texto”,

OpenAI escribió.

ChatGPT-4 tiene un tamaño mayor que sus predecesores, lo que indica que ha sido entrenado con una mayor cantidad de datos y contiene más pesos en su archivo de modelo, lo que resulta en un mayor costo para su operación. El lenguaje de IA más nuevo puede generar texto similar al humano mediante el uso deep learning y estar pre-entrenado en un gran conjunto de datos.

GPT-4 tiene demostró un rendimiento superior sobre otros lenguajes de IA en una variedad de exámenes y pruebas debido en parte a su capacidad para acceder a información y detalles adicionales a través de imágenes que pueden no estar disponibles en forma escrita.

El nuevo GPT-4 El modelo puede decirle qué se representa exactamente en la ilustración, analizarlo e incluso explicar su significado. En la demostración, GPT-4 Explicó el chiste visual donde se conecta un cable VGA al iPhone. También podría explicar qué es inusual en una imagen que muestra un "planchado extremo", que puede consultar a continuación.

gpt-4 imágenes
Fuente: OpenAI

Sin embargo, también hay implicaciones más útiles para GPT-4El conocimiento recién adquirido. En la presentación se demostró que PGT-4 podía decir qué se podía cocinar a partir de los ingredientes que se muestran en la imagen. Esto significa que el modelo puede ayudarte a cocinar si tienes productos alimenticios y no sabes qué hacer con ellos. Tome una instantánea de la comida que tiene y chatee.GPT Te puedo decir qué puedes preparar con los ingredientes que tienes en casa.

Esta capacidad de comprender e interpretar información visual hace GPT-4 una poderosa herramienta para tareas como subtítulos de imágenes, respuesta visual a preguntas e incluso creación de contenido. Con la integración de la comprensión textual y visual, GPT-4 tiene el potencial de revolucionar diversas industrias, como la publicidad, el diseño y el comercio electrónico, y ayudar a las personas a realizar las tareas aburridas y mundanas por ellas.

La avanzada modelo de lenguaje También "comprende" capturas de pantalla y documentos con texto, tablas, diagramas u otras representaciones visuales. Por ejemplo, si carga un trabajo de investigación de tres páginas y necesita resumirlo y explicarlo, GPT-4 es capaz de hacerlo. 

El presentador de Bloomberg, Jon Erlichman, demostró cómo pudo transformar un diseño hecho a mano en un sitio web funcional.

La nueva tecnología también se puede utilizar como ayuda para la movilidad, ya que podría utilizarse para describir el entorno de las personas con discapacidad visual. Con este fin, Open AI ya se ha asociado con una aplicación llamada Se mis ojos que ha sido diseñado para ayudar a las personas ciegas cuando necesitan echar un vistazo a algo, por ejemplo, mientras van de compras. La aplicación permite que "voluntarios y profesionales videntes presten sus ojos para resolver tareas grandes y pequeñas para ayudar a las personas ciegas y con baja visión a llevar una vida más independiente". Ahora, también ofrece una herramienta de voluntariado virtual impulsada por OpenAI, GPT-4.

Aunque OpenAI, GPT-4 Actualmente ofrece la capacidad de procesar texto e imágenes como entradas, el modelo aún no está equipado para manejar entradas de audio y video. Sin embargo, hay indicios de que estas modalidades podrían incluirse en la próxima versión de la tecnología.

Más información:

Observación

En línea con la Directrices del Proyecto Confianza, tenga en cuenta que la información proporcionada en esta página no pretende ser ni debe interpretarse como asesoramiento legal, fiscal, de inversión, financiero o de cualquier otro tipo. Es importante invertir sólo lo que pueda permitirse perder y buscar asesoramiento financiero independiente si tiene alguna duda. Para mayor información sugerimos consultar los términos y condiciones así como las páginas de ayuda y soporte proporcionadas por el emisor o anunciante. MetaversePost se compromete a brindar informes precisos e imparciales, pero las condiciones del mercado están sujetas a cambios sin previo aviso.

Sobre el Autor

Agne es una periodista que cubre las últimas tendencias y desarrollos en metaverso, IA y Web3 industrias para la Metaverse Post. Su pasión por contar historias la ha llevado a realizar numerosas entrevistas con expertos en estos campos, buscando siempre descubrir historias apasionantes y atrapantes. Agne tiene una licenciatura en literatura y tiene una amplia experiencia escribiendo sobre una amplia gama de temas, incluidos viajes, arte y cultura. También se ofreció como editora voluntaria de la organización de derechos de los animales, donde ayudó a crear conciencia sobre cuestiones de bienestar animal. Contáctala en [email protected].

Más artículos
Agne Cimerman
Agne Cimerman

Agne es una periodista que cubre las últimas tendencias y desarrollos en metaverso, IA y Web3 industrias para la Metaverse Post. Su pasión por contar historias la ha llevado a realizar numerosas entrevistas con expertos en estos campos, buscando siempre descubrir historias apasionantes y atrapantes. Agne tiene una licenciatura en literatura y tiene una amplia experiencia escribiendo sobre una amplia gama de temas, incluidos viajes, arte y cultura. También se ofreció como editora voluntaria de la organización de derechos de los animales, donde ayudó a crear conciencia sobre cuestiones de bienestar animal. Contáctala en [email protected].

Hot Stories
Suscríbase a nuestro boletín.
Últimas Noticias

Llega el día de la sentencia: el destino de CZ pende de un hilo mientras un tribunal de EE. UU. considera la petición del Departamento de Justicia

Changpeng Zhao está listo para enfrentar hoy su sentencia en un tribunal estadounidense en Seattle.

Para saber más

Los fundadores de Samourai Wallet son acusados ​​de facilitar 2 millones de dólares en acuerdos en la Darknet

La detención de los fundadores de Samourai Wallet representa un revés notable para la industria, lo que subraya la persistente...

Para saber más
Únase a nuestra comunidad tecnológica innovadora
Leer Más
Leer más
Ankr colabora con la plataforma AI Blockchain Talus Network para desbloquear la liquidez de Bitcoin para la IA
Empresa Informe de noticias Tecnología
Ankr colabora con la plataforma AI Blockchain Talus Network para desbloquear la liquidez de Bitcoin para la IA
1 de mayo de 2024
Binance Labs apoya los laboratorios de movimiento para facilitar la integración de movimientos de Facebook a través de blockchains
Empresa Informe de noticias Tecnología
Binance Labs apoya los laboratorios de movimiento para facilitar la integración de movimientos de Facebook a través de blockchains
1 de mayo de 2024
Las naciones BRICS miran la solución comercial de monedas estables
Empresa Industrias Historias y comentarios Tecnología
Las naciones BRICS miran la solución comercial de monedas estables
1 de mayo de 2024
Bitcoin L2 Network BOB se integra con LayerZero para una funcionalidad mejorada
Empresa Informe de noticias Tecnología
Bitcoin L2 Network BOB se integra con LayerZero para una funcionalidad mejorada
1 de mayo de 2024
CRYPTOMERIA LABORATORIOS PTE. LIMITADO.