GPT-4 Puede manejar sus solicitudes de imágenes, documentos, diagramas y capturas de pantalla
En Resumen
GPT-4 puede manejar solicitudes de imágenes, documentos, diagramas y capturas de pantalla. Es una mejora respecto a GPT-3, que solo manejaba texto.
GPT-4 tiene un rendimiento superior en varios exámenes y pruebas y puede acceder a información y detalles adicionales a través de imágenes que pueden no estar disponibles en forma escrita.
OpenAIEl último hito de 's, el nuevo modelo GPT-4, puede aceptar solicitudes que incluyan imágenes, documentos con texto, diagramas o capturas de pantalla como entradas. Esto representa una mejora significativa con respecto a la versión anterior, GPT-3, que solo podía comprender y generar texto. Con esta nueva característica, GPT-4 genera salidas de texto dadas las entradas que consisten en texto e imágenes intercaladas.
“En una variedad de dominios, incluidos documentos con texto y fotografías, diagramas o capturas de pantalla,GPT-4 exhibe capacidades similares a las de las entradas de solo texto”,
OpenAI escribió.
ChatGPT-4 tiene un tamaño mayor que sus predecesores, lo que indica que ha sido entrenado con una mayor cantidad de datos y contiene más pesos en su archivo de modelo, lo que resulta en un mayor costo para su operación. El lenguaje de IA más nuevo puede generar texto similar al humano mediante el uso deep learning y estar pre-entrenado en un gran conjunto de datos.
GPT-4 tiene demostró un rendimiento superior sobre otros lenguajes de IA en una variedad de exámenes y pruebas debido en parte a su capacidad para acceder a información y detalles adicionales a través de imágenes que pueden no estar disponibles en forma escrita.
El nuevo GPT-4 El modelo puede decirle qué se representa exactamente en la ilustración, analizarlo e incluso explicar su significado. En la demostración, GPT-4 Explicó el chiste visual donde se conecta un cable VGA al iPhone. También podría explicar qué es inusual en una imagen que muestra un "planchado extremo", que puede consultar a continuación.
Sin embargo, también hay implicaciones más útiles para GPT-4El conocimiento recién adquirido. En la presentación se demostró que PGT-4 podía decir qué se podía cocinar a partir de los ingredientes que se muestran en la imagen. Esto significa que el modelo puede ayudarte a cocinar si tienes productos alimenticios y no sabes qué hacer con ellos. Tome una instantánea de la comida que tiene y chatee.GPT Te puedo decir qué puedes preparar con los ingredientes que tienes en casa.
Esta capacidad de comprender e interpretar información visual hace GPT-4 una poderosa herramienta para tareas como subtítulos de imágenes, respuesta visual a preguntas e incluso creación de contenido. Con la integración de la comprensión textual y visual, GPT-4 tiene el potencial de revolucionar diversas industrias, como la publicidad, el diseño y el comercio electrónico, y ayudar a las personas a realizar las tareas aburridas y mundanas por ellas.
La avanzada modelo de lenguaje También "comprende" capturas de pantalla y documentos con texto, tablas, diagramas u otras representaciones visuales. Por ejemplo, si carga un trabajo de investigación de tres páginas y necesita resumirlo y explicarlo, GPT-4 es capaz de hacerlo.
El presentador de Bloomberg, Jon Erlichman, demostró cómo pudo transformar un diseño hecho a mano en un sitio web funcional.
La nueva tecnología también se puede utilizar como ayuda para la movilidad, ya que podría utilizarse para describir el entorno de las personas con discapacidad visual. Con este fin, Open AI ya se ha asociado con una aplicación llamada Se mis ojos que ha sido diseñado para ayudar a las personas ciegas cuando necesitan echar un vistazo a algo, por ejemplo, mientras van de compras. La aplicación permite que "voluntarios y profesionales videntes presten sus ojos para resolver tareas grandes y pequeñas para ayudar a las personas ciegas y con baja visión a llevar una vida más independiente". Ahora, también ofrece una herramienta de voluntariado virtual impulsada por OpenAI, GPT-4.
Aunque OpenAI, GPT-4 Actualmente ofrece la capacidad de procesar texto e imágenes como entradas, el modelo aún no está equipado para manejar entradas de audio y video. Sin embargo, hay indicios de que estas modalidades podrían incluirse en la próxima versión de la tecnología.
Más información:
- Las 7 principales empresas que adoptaron GPT-4
- GPT-4-Establecido ChatGPT Supera GPT-3 por un factor de 570
- Microsoft confirma que Bing se ejecuta en la versión avanzada GPT-4 Modelo
- GPT-4 vs GPT-3: ¿Qué tiene que ofrecer el nuevo modelo?
Observación
En línea con la Directrices del Proyecto Confianza, tenga en cuenta que la información proporcionada en esta página no pretende ser ni debe interpretarse como asesoramiento legal, fiscal, de inversión, financiero o de cualquier otro tipo. Es importante invertir sólo lo que pueda permitirse perder y buscar asesoramiento financiero independiente si tiene alguna duda. Para mayor información sugerimos consultar los términos y condiciones así como las páginas de ayuda y soporte proporcionadas por el emisor o anunciante. MetaversePost se compromete a brindar informes precisos e imparciales, pero las condiciones del mercado están sujetas a cambios sin previo aviso.
Sobre el Autor
Agne es una periodista que cubre las últimas tendencias y desarrollos en metaverso, IA y Web3 industrias para la Metaverse Post. Su pasión por contar historias la ha llevado a realizar numerosas entrevistas con expertos en estos campos, buscando siempre descubrir historias apasionantes y atrapantes. Agne tiene una licenciatura en literatura y tiene una amplia experiencia escribiendo sobre una amplia gama de temas, incluidos viajes, arte y cultura. También se ofreció como editora voluntaria de la organización de derechos de los animales, donde ayudó a crear conciencia sobre cuestiones de bienestar animal. Contáctala en [email protected].
Más artículosAgne es una periodista que cubre las últimas tendencias y desarrollos en metaverso, IA y Web3 industrias para la Metaverse Post. Su pasión por contar historias la ha llevado a realizar numerosas entrevistas con expertos en estos campos, buscando siempre descubrir historias apasionantes y atrapantes. Agne tiene una licenciatura en literatura y tiene una amplia experiencia escribiendo sobre una amplia gama de temas, incluidos viajes, arte y cultura. También se ofreció como editora voluntaria de la organización de derechos de los animales, donde ayudó a crear conciencia sobre cuestiones de bienestar animal. Contáctala en [email protected].