GPT-4 Pot gestionar les vostres sol·licituds d'imatges, documents, esquemes i captures de pantalla
En breu
GPT-4 pot gestionar les sol·licituds d'imatges, documents, diagrames i captures de pantalla. És una millora GPT-3, que només gestionava text.
GPT-4 té un rendiment superior en diversos exàmens i proves i pot accedir a informació i detalls addicionals mitjançant imatges que poden no estar disponibles per escrit.
OpenAIl'última fita d'aquest, el nou model GPT-4, pot acceptar sol·licituds que incloguin imatges, documents amb text, diagrames o captures de pantalla com a entrades. Això representa una millora significativa respecte a la versió anterior, GPT-3, que només podia comprendre i emetre text. Amb aquesta nova característica, GPT-4 genera sortides de text donades entrades que consisteixen en text i imatges intercalats.
"En diversos dominis, inclosos documents amb text i fotografies, diagrames o captures de pantalla,GPT-4 presenta capacitats similars a les que ho fa amb les entrades només de text",
OpenAI va escriure.
ChatGPT-4 té una mida més gran que els seus predecessors, la qual cosa indica que s'ha entrenat en una quantitat més gran de dades i conté més pesos en el seu fitxer de model, el que resulta en un cost més elevat per al seu funcionament. El nou llenguatge d'IA pot generar text semblant a l'ésser humà mitjançant l'ús aprenentatge profund i estar entrenat prèviament en un gran conjunt de dades.
GPT-4 té va demostrar un rendiment superior a altres idiomes d'IA en una varietat d'exàmens i proves a causa, en part, de la seva capacitat per accedir a informació i detalls addicionals a través d'imatges que poden no estar disponibles en forma escrita.
El nou GPT-4 El model us pot dir què es representa exactament a la il·lustració, analitzar-lo i fins i tot explicar-ne el significat. A la demostració, GPT-4 va explicar l'acudit visual on es connecta un cable VGA a l'iPhone. També podria explicar què és inusual en una imatge que presenta un "planxat extrem", que podeu consultar a continuació.
Tanmateix, també hi ha implicacions més útils GPT-4els nous coneixements descoberts. En la presentació, es va demostrar que el PGT-4 podia saber què es podia cuinar a partir dels ingredients que es mostren a la imatge. Això vol dir que el model us pot ajudar a cuinar si teniu productes alimentaris i no teniu ni idea de què fer-hi. Fes una instantània del menjar que tens i xateja-GPT et pot dir què pots preparar amb els ingredients que tens a casa.
Aquesta capacitat d'entendre i interpretar la informació visual fa GPT-4 una eina potent per a tasques com ara subtítols d'imatges, respostes visuals a preguntes i fins i tot creació de contingut. Amb la integració tant del text com de la comprensió visual, GPT-4 té el potencial de revolucionar diverses indústries, com ara la publicitat, el disseny i el comerç electrònic, i ajudar la gent a fer les tasques avorrides i mundanes per ells.
L'avançada model lingüístic també "entén" captures de pantalla i documents amb text, taules, diagrames o altres representacions visuals. Per exemple, si pengeu un treball de recerca de tres pàgines i necessiteu que es resumeixi i s'explique, GPT-4 és capaç de fer-ho.
Jon Erlichman, presentador de Bloomberg, va demostrar com va ser capaç de transformar un disseny dibuixat a mà en un lloc web funcional.
La nova tecnologia també es pot utilitzar com a ajuda per a la mobilitat, ja que es podria utilitzar per descriure l'entorn de les persones amb discapacitat visual. Amb aquesta finalitat, Open AI ja s'ha associat amb una aplicació anomenada Sigues els meus ulls que s'ha dissenyat per donar un cop de mà a les persones cegues quan necessiten fer una ullada a alguna cosa, per exemple, a l'hora de comprar queviures. L'aplicació permet que "els voluntaris i professionals vidents prestin els seus ulls per resoldre tasques grans i petites per ajudar les persones cegues i amb poca visió a portar vides més independents". Ara, també ofereix una eina de voluntariat virtual impulsada per OpenAI'S GPT-4.
Encara OpenAI'S GPT-4 actualment ofereix la possibilitat de processar text i imatges com a entrades, el model encara no està equipat per gestionar entrades d'àudio i vídeo. No obstant això, hi ha indicis que aquestes modalitats es podrien incloure en la propera iteració de la tecnologia.
Llegir més:
- Les 7 millors empreses que van adoptar GPT-4
- GPT-4-Basada ChatGPT Superiors GPT-3 per un factor de 570
- Microsoft confirma que Bing s'executa a Advanced GPT-4 model
- GPT-4 vs GPT-3: Què ofereix el nou model?
renúncia
En línia amb la Directrius del projecte Trust, si us plau, tingueu en compte que la informació proporcionada en aquesta pàgina no pretén ni s'ha d'interpretar com a assessorament legal, fiscal, d'inversió, financer o de cap altra forma. És important invertir només el que et pots permetre perdre i buscar assessorament financer independent si tens dubtes. Per obtenir més informació, us suggerim que feu referència als termes i condicions, així com a les pàgines d'ajuda i assistència proporcionades per l'emissor o l'anunciant. MetaversePost es compromet a fer informes precisos i imparcials, però les condicions del mercat estan subjectes a canvis sense previ avís.
About The Autor
L'Agne és una periodista que cobreix les últimes tendències i desenvolupaments en el metavers, IA i Web3 indústries per a Metaverse Post. La seva passió per la narració l'ha portat a realitzar nombroses entrevistes amb experts en aquests camps, sempre buscant descobrir històries apassionants i atractives. L'Agne és llicenciada en literatura i té una àmplia experiència en l'escriptura sobre una àmplia gamma de temes, com ara viatges, art i cultura. També ha estat voluntaria com a editora de l'organització dels drets dels animals, on va ajudar a conscienciar sobre els problemes de benestar animal. Contacta amb ella [protegit per correu electrònic].
més articlesL'Agne és una periodista que cobreix les últimes tendències i desenvolupaments en el metavers, IA i Web3 indústries per a Metaverse Post. La seva passió per la narració l'ha portat a realitzar nombroses entrevistes amb experts en aquests camps, sempre buscant descobrir històries apassionants i atractives. L'Agne és llicenciada en literatura i té una àmplia experiència en l'escriptura sobre una àmplia gamma de temes, com ara viatges, art i cultura. També ha estat voluntaria com a editora de l'organització dels drets dels animals, on va ajudar a conscienciar sobre els problemes de benestar animal. Contacta amb ella [protegit per correu electrònic].