Informe de notícies Tecnologia
Març 15, 2023

GPT-4 Pot gestionar les vostres sol·licituds d'imatges, documents, esquemes i captures de pantalla

En breu

GPT-4 pot gestionar les sol·licituds d'imatges, documents, diagrames i captures de pantalla. És una millora GPT-3, que només gestionava text.

GPT-4 té un rendiment superior en diversos exàmens i proves i pot accedir a informació i detalls addicionals mitjançant imatges que poden no estar disponibles per escrit.

gpt-4 imatges documents captures de pantalla

OpenAIl'última fita d'aquest, el nou model GPT-4, pot acceptar sol·licituds que incloguin imatges, documents amb text, diagrames o captures de pantalla com a entrades. Això representa una millora significativa respecte a la versió anterior, GPT-3, que només podia comprendre i emetre text. Amb aquesta nova característica, GPT-4 genera sortides de text donades entrades que consisteixen en text i imatges intercalats.

"En diversos dominis, inclosos documents amb text i fotografies, diagrames o captures de pantalla,GPT-4 presenta capacitats similars a les que ho fa amb les entrades només de text",

OpenAI va escriure.

ChatGPT-4 té una mida més gran que els seus predecessors, la qual cosa indica que s'ha entrenat en una quantitat més gran de dades i conté més pesos en el seu fitxer de model, el que resulta en un cost més elevat per al seu funcionament. El nou llenguatge d'IA pot generar text semblant a l'ésser humà mitjançant l'ús aprenentatge profund i estar entrenat prèviament en un gran conjunt de dades.

GPT-4 té va demostrar un rendiment superior a altres idiomes d'IA en una varietat d'exàmens i proves a causa, en part, de la seva capacitat per accedir a informació i detalls addicionals a través d'imatges que poden no estar disponibles en forma escrita.

El nou GPT-4 El model us pot dir què es representa exactament a la il·lustració, analitzar-lo i fins i tot explicar-ne el significat. A la demostració, GPT-4 va explicar l'acudit visual on es connecta un cable VGA a l'iPhone. També podria explicar què és inusual en una imatge que presenta un "planxat extrem", que podeu consultar a continuació.

gpt-4 imatges
font: OpenAI

Tanmateix, també hi ha implicacions més útils GPT-4els nous coneixements descoberts. En la presentació, es va demostrar que el PGT-4 podia saber què es podia cuinar a partir dels ingredients que es mostren a la imatge. Això vol dir que el model us pot ajudar a cuinar si teniu productes alimentaris i no teniu ni idea de què fer-hi. Fes una instantània del menjar que tens i xateja-GPT et pot dir què pots preparar amb els ingredients que tens a casa.

Aquesta capacitat d'entendre i interpretar la informació visual fa GPT-4 una eina potent per a tasques com ara subtítols d'imatges, respostes visuals a preguntes i fins i tot creació de contingut. Amb la integració tant del text com de la comprensió visual, GPT-4 té el potencial de revolucionar diverses indústries, com ara la publicitat, el disseny i el comerç electrònic, i ajudar la gent a fer les tasques avorrides i mundanes per ells.

L'avançada model lingüístic també "entén" captures de pantalla i documents amb text, taules, diagrames o altres representacions visuals. Per exemple, si pengeu un treball de recerca de tres pàgines i necessiteu que es resumeixi i s'explique, GPT-4 és capaç de fer-ho. 

Jon Erlichman, presentador de Bloomberg, va demostrar com va ser capaç de transformar un disseny dibuixat a mà en un lloc web funcional.

La nova tecnologia també es pot utilitzar com a ajuda per a la mobilitat, ja que es podria utilitzar per descriure l'entorn de les persones amb discapacitat visual. Amb aquesta finalitat, Open AI ja s'ha associat amb una aplicació anomenada Sigues els meus ulls que s'ha dissenyat per donar un cop de mà a les persones cegues quan necessiten fer una ullada a alguna cosa, per exemple, a l'hora de comprar queviures. L'aplicació permet que "els voluntaris i professionals vidents prestin els seus ulls per resoldre tasques grans i petites per ajudar les persones cegues i amb poca visió a portar vides més independents". Ara, també ofereix una eina de voluntariat virtual impulsada per OpenAI'S GPT-4.

Encara OpenAI'S GPT-4 actualment ofereix la possibilitat de processar text i imatges com a entrades, el model encara no està equipat per gestionar entrades d'àudio i vídeo. No obstant això, hi ha indicis que aquestes modalitats es podrien incloure en la propera iteració de la tecnologia.

Llegir més:

renúncia

En línia amb la Directrius del projecte Trust, si us plau, tingueu en compte que la informació proporcionada en aquesta pàgina no pretén ni s'ha d'interpretar com a assessorament legal, fiscal, d'inversió, financer o de cap altra forma. És important invertir només el que et pots permetre perdre i buscar assessorament financer independent si tens dubtes. Per obtenir més informació, us suggerim que feu referència als termes i condicions, així com a les pàgines d'ajuda i assistència proporcionades per l'emissor o l'anunciant. MetaversePost es compromet a fer informes precisos i imparcials, però les condicions del mercat estan subjectes a canvis sense previ avís.

About The Autor

L'Agne és una periodista que cobreix les últimes tendències i desenvolupaments en el metavers, IA i Web3 indústries per a Metaverse Post. La seva passió per la narració l'ha portat a realitzar nombroses entrevistes amb experts en aquests camps, sempre buscant descobrir històries apassionants i atractives. L'Agne és llicenciada en literatura i té una àmplia experiència en l'escriptura sobre una àmplia gamma de temes, com ara viatges, art i cultura. També ha estat voluntaria com a editora de l'organització dels drets dels animals, on va ajudar a conscienciar sobre els problemes de benestar animal. Contacta amb ella [protegit per correu electrònic].

més articles
Agne Cimerman
Agne Cimerman

L'Agne és una periodista que cobreix les últimes tendències i desenvolupaments en el metavers, IA i Web3 indústries per a Metaverse Post. La seva passió per la narració l'ha portat a realitzar nombroses entrevistes amb experts en aquests camps, sempre buscant descobrir històries apassionants i atractives. L'Agne és llicenciada en literatura i té una àmplia experiència en l'escriptura sobre una àmplia gamma de temes, com ara viatges, art i cultura. També ha estat voluntaria com a editora de l'organització dels drets dels animals, on va ajudar a conscienciar sobre els problemes de benestar animal. Contacta amb ella [protegit per correu electrònic].

Hot Stories
Uneix-te al nostre butlletí.
Últimes notícies

Arriba el dia de la sentència: el destí de CZ està en equilibri mentre el tribunal nord-americà considera la petició del DOJ

Changpeng Zhao està a punt d'enfrontar-se avui a la sentència en un tribunal dels Estats Units a Seattle.

saber Més

Fundadors de Samourai Wallet acusats de facilitar 2 milions de dòlars en ofertes de Darknet

L'aprehensió dels fundadors de Samourai Wallet representa un revés notable per a la indústria, subratllant la persistent ...

saber Més
Uneix-te a la nostra comunitat tecnològica innovadora
Més...
Llegeix més
Ankr col·labora amb AI Blockchain Platform Talus Network per desbloquejar Bitcoin Liquidity per a AI
Negocis Informe de notícies Tecnologia
Ankr col·labora amb AI Blockchain Platform Talus Network per desbloquejar Bitcoin Liquidity per a AI
Pot 1, 2024
Binance Labs admet Movement Labs per facilitar la integració de Move de Facebook a través de Blockchains
Negocis Informe de notícies Tecnologia
Binance Labs admet Movement Labs per facilitar la integració de Move de Facebook a través de Blockchains
Pot 1, 2024
Solució de comerç de monedes estables de BRICS Nations Eye
Negocis mercats Històries i ressenyes Tecnologia
Solució de comerç de monedes estables de BRICS Nations Eye
Pot 1, 2024
Bitcoin L2 Network BOB s'integra amb LayerZero per a una funcionalitat millorada
Negocis Informe de notícies Tecnologia
Bitcoin L2 Network BOB s'integra amb LayerZero per a una funcionalitat millorada
Pot 1, 2024
CRYPTOMERIA LABS PTE. LTD.