Tudósítást Technológia
Március 15, 2023

GPT-4 Képes, dokumentumok, diagramok és képernyőképek iránti kéréseit kezeli

Röviden

GPT-4 képes kezelni a képekre, dokumentumokra, diagramokra és képernyőképekre vonatkozó kéréseket. Ez előrelépés GPT-3, amely csak szöveget kezelt.

GPT-4 kiváló teljesítményt nyújt a különböző vizsgákon és teszteken, és további információkhoz és részletekhez férhet hozzá olyan képeken keresztül, amelyek esetleg nem állnak rendelkezésre írásos formában.

gpt-4 képek dokumentumok képernyőképek

OpenAIlegújabb mérföldköve, az új modell GPT-4, képes fogadni olyan kéréseket, amelyek bemenetként képeket, szöveges dokumentumokat, diagramokat vagy képernyőképeket tartalmaznak. Ez jelentős előrelépést jelent az előző verzióhoz képest, GPT-3, amely csak szöveget tudott megérteni és kiadni. Ezzel az új funkcióval GPT-4 szöveges kimeneteket generál adott bemenetek között, amelyek között szövegek és képek állnak.

„Számos tartományban – beleértve a szöveget és fényképeket tartalmazó dokumentumokat, diagramokat vagy képernyőképeket –GPT-4 hasonló képességekkel rendelkezik, mint a csak szöveges bemeneteknél"

OpenAI írt.

ChatGPT-4 mérete nagyobb, mint elődei, ami azt jelzi, hogy nagyobb adatmennyiségen végzett betanítást, és több súlyt tartalmaz a modellfájlban, ami magasabb működési költséget eredményez. A legújabb mesterséges intelligencia nyelv segítségével emberszerű szöveget tud generálni mély tanulás és előképzett egy nagy adathalmazra.

GPT-4 több mint kiváló teljesítményt mutatott a többi AI nyelvhez képest számos vizsgán és teszten, részben annak köszönhetően, hogy képes további információkhoz és részletekhez hozzáférni olyan képeken keresztül, amelyek esetleg nem állnak rendelkezésre írásos formában.

Az új GPT-4 A modell meg tudja mondani, hogy pontosan mit ábrázol az illusztráció, elemzi azt, és még a jelentését is meg tudja magyarázni. A demóban GPT-4 magyarázta a vizuális viccet, ahol VGA-kábel csatlakozik az iPhone-hoz. Azt is megmagyarázhatja, hogy mi a szokatlan egy „extrém vasalást” bemutató képen, amelyet alább megtekinthet.

gpt-4 képek
Forrás: OpenAI

Vannak azonban hasznosabb következményei is GPT-4újonnan szerzett tudása. Az előadáson megmutatták, hogy a PGT-4 meg tudja mondani, mit lehet főzni a képen látható alapanyagokból. Ez azt jelenti, hogy a modell segíthet a főzésben, ha vannak élelmiszerei, és fogalma sincs, mit kezdjen velük. Készíts egy pillanatképet az ételedről, és Chat-GPT meg tudja mondani, mit tud elkészíteni az otthon lévő hozzávalókból.

Ez a képesség a vizuális információk megértésére és értelmezésére teszi GPT-4 hatékony eszköz olyan feladatokhoz, mint a képaláírások, a vizuális kérdések megválaszolása és még a tartalomkészítés is. A szöveg és a vizuális megértés integrálásával, GPT-4 képes forradalmasítani a különféle iparágakat, például a reklámozást, a tervezést és az e-kereskedelmet, és segíteni az embereknek az unalmas, hétköznapi feladatok elvégzésében.

A fejlett nyelvi modell a képernyőképeket és a szöveget, táblázatokat, diagramokat vagy más vizuális ábrázolásokat tartalmazó dokumentumokat is „megérti”. Például, ha feltölt egy háromoldalas kutatási cikket, és össze kell foglalnia és el kell magyaráznia, GPT-4 képes erre. 

A Bloomberg horgonya, Jon Erlichman bemutatta, hogyan volt képes egy kézzel vázolt dizájnt funkcionális weboldalzá alakítani.

Az új technológia mozgást segítő eszközként is használható, mivel a látássérültek környezetének leírására is használható. Ennek érdekében az Open AI már társult egy nevű alkalmazással Legyél a szemem amelyet arra terveztek, hogy segítő kezet nyújtson a vakoknak, amikor meg kell nézniük valamit, például élelmiszervásárlás közben. Az alkalmazás lehetővé teszi „a látó önkéntesek és szakemberek számára, hogy kis és nagy feladatokat oldjanak meg, hogy segítsenek a vakok és gyengénlátók önállóbb életvitelében”. Mostantól egy virtuális önkéntes eszközt is kínál, amelyet a OpenAI'S GPT-4.

Bár OpenAI'S GPT-4 jelenleg szövegek és képek bemenetként való feldolgozását kínálja, a modell még nincs felszerelve audio- és videobemenetek kezelésére. Mindazonáltal vannak arra utaló jelek, hogy ezek a módozatok beépülhetnek a technológia következő iterációjába.

Bővebben:

A felelősség megtagadása

Összhangban a A Trust Project irányelvei, kérjük, vegye figyelembe, hogy az ezen az oldalon közölt információk nem minősülnek jogi, adózási, befektetési, pénzügyi vagy bármilyen más formájú tanácsnak, és nem is értelmezhetők. Fontos, hogy csak annyit fektessen be, amennyit megengedhet magának, hogy elveszítsen, és kérjen független pénzügyi tanácsot, ha kétségei vannak. További információkért javasoljuk, hogy tekintse meg a szerződési feltételeket, valamint a kibocsátó vagy hirdető által biztosított súgó- és támogatási oldalakat. MetaversePost elkötelezett a pontos, elfogulatlan jelentéstétel mellett, de a piaci feltételek előzetes értesítés nélkül változhatnak.

A szerzőről

Agne újságíró, aki a metaverzum legújabb trendjeivel és fejleményeivel foglalkozik, az AI és Web3 iparágak számára Metaverse Post. A történetmesélés iránti szenvedélye arra késztette, hogy számos interjút készített e területek szakértőivel, mindig izgalmas és lebilincselő történetek feltárására törekedve. Agne irodalomból bachelor diplomát szerzett, és széleskörű írási háttérrel rendelkezik számos témakörben, beleértve az utazást, a művészetet és a kultúrát. Önkéntesként jelentkezett szerkesztőként az állatvédő szervezetnél is, ahol segített felhívni a figyelmet az állatjóléti kérdésekre. Vegye fel vele a kapcsolatot [e-mail védett].

További cikkek
Cimerman Ágne
Cimerman Ágne

Agne újságíró, aki a metaverzum legújabb trendjeivel és fejleményeivel foglalkozik, az AI és Web3 iparágak számára Metaverse Post. A történetmesélés iránti szenvedélye arra késztette, hogy számos interjút készített e területek szakértőivel, mindig izgalmas és lebilincselő történetek feltárására törekedve. Agne irodalomból bachelor diplomát szerzett, és széleskörű írási háttérrel rendelkezik számos témakörben, beleértve az utazást, a művészetet és a kultúrát. Önkéntesként jelentkezett szerkesztőként az állatvédő szervezetnél is, ahol segített felhívni a figyelmet az állatjóléti kérdésekre. Vegye fel vele a kapcsolatot [e-mail védett].

Elérkezett az ítélethirdetés napja: CZ sorsa egyensúlyban van, mivel az Egyesült Államok bírósága mérlegeli a DOJ kérelmét

Changpeng Zhao ítéletet vár ma egy seattle-i amerikai bíróságon.

Tudjon meg többet

A Samourai Wallet alapítóit azzal vádolják, hogy 2 milliárd dollárt segítettek a Darknet ügyletekben

A Samourai Wallet alapítóinak aggodalma jelentős visszalépést jelent az iparág számára, aláhúzva a kitartó ...

Tudjon meg többet
Csatlakozzon innovatív technológiai közösségünkhöz
KATT ide
Tovább
Az AI reneszánsza a játékfejlesztésben 2024-ben
AI Wiki metaverse Wiki Oktatás piacok szoftver Technológia
Az AI reneszánsza a játékfejlesztésben 2024-ben
May 1, 2024
Az Estée Lauder új mesterséges intelligencia-laboratóriumában: Közelebbről, hogyan alakítja át a generatív mesterséges intelligencia a szépségmárkákat
Életmód szoftver Történetek és vélemények Technológia
Az Estée Lauder új mesterséges intelligencia-laboratóriumában: Közelebbről, hogyan alakítja át a generatív mesterséges intelligencia a szépségmárkákat
May 1, 2024
A Chainlink és a Rapid Addition együttműködik a CCIP-alapú blokklánc-adapter fejlesztésében
üzleti Tudósítást Technológia
A Chainlink és a Rapid Addition együttműködik a CCIP-alapú blokklánc-adapter fejlesztésében
May 1, 2024
A BitSmiley elindítja az Alphanet V1-et, debütál a Bitcoin Layer 2 hálózati bitrétegen
Tudósítást Technológia
A BitSmiley elindítja az Alphanet V1-et, debütál a Bitcoin Layer 2 hálózati bitrétegen
May 1, 2024
CRYPTOMERIA LABS PTE. KFT.