Notizie Tecnologia
15 Marzo 2023

GPT-4 Può gestire le tue richieste di immagini, documenti, diagrammi e schermate

In Breve

GPT-4 può gestire richieste di immagini, documenti, diagrammi e screenshot. È un miglioramento GPT-3, che gestiva solo il testo.

GPT-4 ha prestazioni superiori in vari esami e test e può accedere a informazioni e dettagli aggiuntivi attraverso immagini che potrebbero non essere disponibili in forma scritta.

gpt-4 immagini, documenti, screenshot

OpenAIL'ultima pietra miliare, il nuovo modello GPT-4, può accettare richieste che includono immagini, documenti con testo, diagrammi o screenshot come input. Ciò rappresenta un miglioramento significativo rispetto alla versione precedente, GPT-3, che poteva solo comprendere e produrre testo. Con questa nuova funzionalità, GPT-4 genera output di testo dati input costituiti da testo e immagini intervallati.

"In una vasta gamma di ambiti, inclusi documenti con testo e fotografie, diagrammi o schermate,GPT-4 mostra funzionalità simili a quelle degli input di solo testo,"

OpenAI ha scritto.

ChatGPT-4 ha una dimensione maggiore rispetto ai suoi predecessori, indicando che è stato sottoposto ad addestramento su una maggiore quantità di dati e contiene più pesi nel file del modello, con conseguente costo maggiore per il suo funzionamento. Il più recente linguaggio AI può generare testo simile a quello umano utilizzando apprendimento profondo ed essere pre-addestrato su un grande set di dati.

GPT-4 ha ha dimostrato prestazioni superiori rispetto ad altri linguaggi AI in una varietà di esami e test grazie in parte alla sua capacità di accedere a informazioni e dettagli aggiuntivi attraverso immagini che potrebbero non essere disponibili in forma scritta.

Il nuovo GPT-4 Il modello può dirti cosa è raffigurato esattamente nell'illustrazione, analizzarlo e persino spiegarne il significato. Nella dimostrazione, GPT-4 ha spiegato lo scherzo visivo in cui un cavo VGA è collegato all'iPhone. Potrebbe anche spiegare cosa c'è di insolito in un'immagine che presenta una "stiratura estrema", che puoi controllare di seguito.

gpt-4 immagini
Fonte: OpenAI

Tuttavia, ci sono anche implicazioni più utili GPT-4è la nuova conoscenza. Nella presentazione è stato dimostrato che PGT-4 è in grado di distinguere cosa si può cucinare dagli ingredienti mostrati nell'immagine. Ciò significa che il modello può aiutarti a cucinare se hai dei prodotti alimentari e non hai idea di cosa farne. Scatta una foto del cibo che hai e chatta-GPT posso dirti cosa puoi preparare con gli ingredienti che hai a casa.

Questa capacità di comprendere e interpretare le informazioni visive rende GPT-4 un potente strumento per attività quali didascalie di immagini, risposte visive a domande e persino creazione di contenuti. Con l'integrazione della comprensione sia testuale che visiva, GPT-4 ha il potenziale per rivoluzionare vari settori, come la pubblicità, il design e l'e-commerce, e aiutare le persone a svolgere compiti noiosi e banali per loro.

L'avanzata modello linguistico inoltre "comprende" screenshot e documenti con testo, tabelle, diagrammi o altre rappresentazioni visive. Ad esempio, se carichi un documento di ricerca di tre pagine e hai bisogno che venga riassunto e spiegato, GPT-4 è in grado di farlo. 

L'ancora di Bloomberg, Jon Erlichman, ha dimostrato come è stato in grado di trasformare un disegno disegnato a mano in un sito web funzionale.

La nuova tecnologia può essere utilizzata anche come ausilio per la mobilità in quanto potrebbe essere utilizzata per descrivere l'ambiente per le persone ipovedenti. A tal fine, Open AI ha già collaborato con un'applicazione chiamata Sii i miei occhi che è stato progettato per dare una mano ai non vedenti quando hanno bisogno di dare un'occhiata a qualcosa, ad esempio mentre fanno la spesa. L'app consente a "volontari e professionisti vedenti di prestare i loro occhi per risolvere compiti grandi e piccoli per aiutare le persone non vedenti e ipovedenti a condurre una vita più indipendente". Ora offre anche uno strumento di volontariato virtuale alimentato da OpenAI'S GPT-4.

Sebbene il OpenAI'S GPT-4 attualmente offre la possibilità di elaborare testo e immagini come input, il modello non è ancora attrezzato per gestire input audio e video. Tuttavia, ci sono indicazioni che queste modalità potrebbero essere incluse nella prossima iterazione della tecnologia.

Leggi di più:

Negazione di responsabilità

In linea con la Linee guida del progetto Trust, si prega di notare che le informazioni fornite in questa pagina non intendono essere e non devono essere interpretate come consulenza legale, fiscale, di investimento, finanziaria o di qualsiasi altra forma. È importante investire solo ciò che puoi permetterti di perdere e chiedere una consulenza finanziaria indipendente in caso di dubbi. Per ulteriori informazioni, suggeriamo di fare riferimento ai termini e alle condizioni nonché alle pagine di aiuto e supporto fornite dall'emittente o dall'inserzionista. MetaversePost si impegna a fornire report accurati e imparziali, ma le condizioni di mercato sono soggette a modifiche senza preavviso.

Circa l'autore

Agne è una giornalista che copre le ultime tendenze e gli sviluppi nel metaverso, AI e Web3 industrie per il Metaverse Post. La sua passione per lo storytelling l'ha portata a condurre numerose interviste con esperti in questi campi, cercando sempre di scoprire storie emozionanti e coinvolgenti. Agne ha conseguito una laurea in lettere e ha una vasta esperienza nella scrittura su una vasta gamma di argomenti tra cui viaggi, arte e cultura. Si è anche offerta volontaria come redattrice per l'organizzazione per i diritti degli animali, dove ha contribuito a sensibilizzare l'opinione pubblica sulle questioni relative al benessere degli animali. Contattala su [email protected].

Altri articoli
Agne Cimermann
Agne Cimermann

Agne è una giornalista che copre le ultime tendenze e gli sviluppi nel metaverso, AI e Web3 industrie per il Metaverse Post. La sua passione per lo storytelling l'ha portata a condurre numerose interviste con esperti in questi campi, cercando sempre di scoprire storie emozionanti e coinvolgenti. Agne ha conseguito una laurea in lettere e ha una vasta esperienza nella scrittura su una vasta gamma di argomenti tra cui viaggi, arte e cultura. Si è anche offerta volontaria come redattrice per l'organizzazione per i diritti degli animali, dove ha contribuito a sensibilizzare l'opinione pubblica sulle questioni relative al benessere degli animali. Contattala su [email protected].

Arriva il giorno della sentenza: il destino di CZ è in bilico mentre la Corte degli Stati Uniti considera l'appello del Dipartimento di Giustizia

Changpeng Zhao è pronto ad affrontare oggi la sentenza in un tribunale americano a Seattle.

Per saperne di più

I fondatori di Samourai Wallet sono accusati di aver facilitato 2 miliardi di dollari in affari nel Darknet

L'apprensione dei fondatori di Samourai Wallet rappresenta una notevole battuta d'arresto per il settore, sottolineando la persistente ...

Per saperne di più
Unisciti alla nostra comunità tecnologica innovativa
Scopri di più
Per saperne di più
Il Rinascimento dell’IA nello sviluppo di giochi nel 2024
AI Wiki metaverse Wiki Istruzione Mercati Software Tecnologia
Il Rinascimento dell’IA nello sviluppo di giochi nel 2024
1 Maggio 2024
All'interno del nuovo AI Innovation Lab di Estée Lauder: uno sguardo più da vicino su come l'intelligenza artificiale generativa sta trasformando i marchi di bellezza
Stile di vita Software Storie e recensioni Tecnologia
All'interno del nuovo AI Innovation Lab di Estée Lauder: uno sguardo più da vicino su come l'intelligenza artificiale generativa sta trasformando i marchi di bellezza
1 Maggio 2024
Chainlink e Rapid Addition collaborano per sviluppare un adattatore Blockchain basato su CCIP
Affari Notizie Tecnologia
Chainlink e Rapid Addition collaborano per sviluppare un adattatore Blockchain basato su CCIP
1 Maggio 2024
BitSmiley lancia Alphanet V1, debutta sul Bitlayer di rete Bitcoin Layer 2
Notizie Tecnologia
BitSmiley lancia Alphanet V1, debutta sul Bitlayer di rete Bitcoin Layer 2
1 Maggio 2024
LABORATORI DI CRITTOMERIA PTE. srl.