Vijesti Tehnologija
Ožujak 15, 2023

GPT-4 Može obraditi vaše zahtjeve za slike, dokumente, dijagrame i snimke zaslona

Ukratko

GPT-4 može obraditi zahtjeve za slike, dokumente, dijagrame i snimke zaslona. To je poboljšanje u odnosu na GPT-3, koji je obrađivao samo tekst.

GPT-4 ima vrhunske rezultate na raznim ispitima i testovima te može pristupiti dodatnim informacijama i detaljima putem slika koje možda nisu dostupne u pisanom obliku.

gpt-4 slike dokumenti snimke zaslona

OpenAIposljednja prekretnica, novi model GPT-4, može prihvatiti zahtjeve koji uključuju slike, dokumente s tekstom, dijagrame ili snimke zaslona kao unose. Ovo predstavlja značajno poboljšanje u odnosu na prethodnu verziju, GPT-3, koji je mogao samo razumjeti i ispisati tekst. S ovom novom značajkom, GPT-4 generira tekstualne izlaze s obzirom na ulaze koji se sastoje od isprepletenog teksta i slika.

“Na nizu domena—uključujući dokumente s tekstom i fotografijama, dijagrame ili snimke zaslona—GPT-4 pokazuje slične mogućnosti kao i kod unosa samo teksta,"

OpenAI napisao.

ChatGPT-4 ima veću veličinu od svojih prethodnika, što ukazuje na to da je prošao obuku na većoj količini podataka i sadrži više težina u svojoj datoteci modela, što je rezultiralo višim troškovima za njegov rad. Najnoviji AI jezik može generirati tekst sličan ljudskom pomoću duboko učenje i biti prethodno obučen na velikom skupu podataka.

GPT-4 ima pokazao superiorne performanse u odnosu na druge AI jezike u raznim ispitima i testovima zahvaljujući djelomično njegovoj mogućnosti pristupa dodatnim informacijama i detaljima putem slika koje možda nisu dostupne u pisanom obliku.

Novo GPT-4 model vam može reći što je točno prikazano na ilustraciji, analizirati to, pa čak i objasniti njegovo značenje. U demonstraciji, GPT-4 objasnio vizualni vic gdje se VGA kabel spaja na iPhone. To bi također moglo objasniti što je neobično na slici koja prikazuje "ekstremno peglanje", a koju možete pogledati u nastavku.

gpt-4 slika
Izvor: OpenAI

Međutim, postoje i korisnije implikacije GPT-4novootkriveno znanje. U prezentaciji je pokazano da PGT-4 može reći što se može skuhati od sastojaka prikazanih na slici. To znači da vam model može pomoći u kuhanju ako imate prehrambene proizvode, a ne znate što s njima. Snimite hranu koju imate i razgovarajteGPT može vam reći što možete pripremiti od sastojaka koje imate kod kuće.

Ova sposobnost razumijevanja i tumačenja vizualnih informacija čini GPT-4 moćan alat za zadatke kao što su opisi slika, vizualni odgovori na pitanja, pa čak i stvaranje sadržaja. Uz integraciju teksta i vizualnog razumijevanja, GPT-4 ima potencijal revolucionirati razne industrije, poput oglašavanja, dizajna i e-trgovine, i pomoći ljudima da obavljaju dosadne, svakodnevne zadatke umjesto njih.

Napredni jezični model također 'razumije' snimke zaslona i dokumente s tekstom, tablicama, dijagramima ili drugim vizualnim prikazima. Na primjer, ako učitate istraživački rad od tri stranice i trebate ga sažeti i objasniti, GPT-4 je sposoban to učiniti. 

Bloombergov voditelj Jon Erlichman pokazao je kako je uspio transformirati ručno skicirani dizajn u funkcionalnu web stranicu.

Nova tehnologija također se može koristiti kao pomoć pri kretanju jer bi se mogla koristiti za opisivanje okoliša za osobe oštećena vida. U tu je svrhu Open AI već sklopio partnerstvo s aplikacijom pod nazivom Budi moje oči koji je osmišljen kako bi slijepim osobama pružio ruku pomoći kada trebaju nešto pogledati, na primjer, dok kupuju namirnice. Aplikacija omogućuje "videćim volonterima i profesionalcima da posude svoje oči za rješavanje velikih i malih zadataka kako bi pomogli slijepim i slabovidnim osobama da vode neovisniji život." Sada nudi i virtualni volonterski alat koji pokreće OpenAI'S GPT-4.

Iako OpenAI'S GPT-4 trenutno nudi mogućnost obrade teksta i slika kao ulaza, model još nije opremljen za rukovanje audio i video ulazima. Unatoč tome, postoje naznake da bi ti modaliteti mogli biti uključeni u sljedeću iteraciju tehnologije.

Pročitajte više:

Izjava o odricanju od odgovornosti

U skladu s Smjernice projekta povjerenja, imajte na umu da informacije navedene na ovoj stranici nemaju namjeru i ne smiju se tumačiti kao pravni, porezni, investicijski, financijski ili bilo koji drugi oblik savjeta. Važno je ulagati samo ono što si možete priuštiti izgubiti i potražiti neovisni financijski savjet ako imate bilo kakvih nedoumica. Za dodatne informacije predlažemo da pogledate odredbe i uvjete, kao i stranice za pomoć i podršku koje pruža izdavatelj ili oglašivač. MetaversePost je predan točnom, nepristranom izvješćivanju, ali tržišni uvjeti podložni su promjenama bez prethodne najave.

O autoru

Agne je novinarka koja pokriva najnovije trendove i razvoj u metaverzumu, umjetnoj inteligenciji i Web3 industrije za Metaverse Post. Njezina strast za pripovijedanjem dovela ju je do brojnih intervjua sa stručnjacima u tim područjima, uvijek nastojeći otkriti uzbudljive i privlačne priče. Agne je diplomirala književnost i ima opsežno iskustvo u pisanju o širokom rasponu tema, uključujući putovanja, umjetnost i kulturu. Također je volontirala kao urednica organizacije za prava životinja, gdje je pomogla u podizanju svijesti o pitanjima dobrobiti životinja. Kontaktirajte je na [e-pošta zaštićena].

Više članaka
Agne Cimerman
Agne Cimerman

Agne je novinarka koja pokriva najnovije trendove i razvoj u metaverzumu, umjetnoj inteligenciji i Web3 industrije za Metaverse Post. Njezina strast za pripovijedanjem dovela ju je do brojnih intervjua sa stručnjacima u tim područjima, uvijek nastojeći otkriti uzbudljive i privlačne priče. Agne je diplomirala književnost i ima opsežno iskustvo u pisanju o širokom rasponu tema, uključujući putovanja, umjetnost i kulturu. Također je volontirala kao urednica organizacije za prava životinja, gdje je pomogla u podizanju svijesti o pitanjima dobrobiti životinja. Kontaktirajte je na [e-pošta zaštićena].

Stiže dan izricanja presude: CZ-ova sudbina visi na ravnoteži dok američki sud razmatra izjavu DOJ-a

Changpeng Zhao danas će se suočiti s kaznom na američkom sudu u Seattleu.

Znati više

Osnivači novčanika Samourai optuženi za omogućavanje 2 milijarde dolara u poslovima Darkneta

Uhićenje osnivača Samourai Walleta predstavlja značajno nazadovanje u industriji, naglašavajući upornu ...

Znati više
Pridružite se našoj zajednici inovativnih tehnologija
opširnije
Čitaj više
AI renesansa u razvoju igara 2024
AI Wiki Metaverse Wiki Obrazovanje tržišta softver Tehnologija
AI renesansa u razvoju igara 2024
Neka 1, 2024
Unutar Estée Lauderovog novog laboratorija za inovacije umjetne inteligencije: bliži pogled na to kako generativna umjetna inteligencija transformira brendove ljepote
Lifestyle softver Priče i recenzije Tehnologija
Unutar Estée Lauderovog novog laboratorija za inovacije umjetne inteligencije: bliži pogled na to kako generativna umjetna inteligencija transformira brendove ljepote
Neka 1, 2024
Chainlink i Rapid Addition surađuju na razvoju Blockchain adaptera temeljenog na CCIP-u
posao Vijesti Tehnologija
Chainlink i Rapid Addition surađuju na razvoju Blockchain adaptera temeljenog na CCIP-u
Neka 1, 2024
BitSmiley lansira Alphanet V1, debitira na Bitcoin Layer 2 Network Bitlayer
Vijesti Tehnologija
BitSmiley lansira Alphanet V1, debitira na Bitcoin Layer 2 Network Bitlayer
Neka 1, 2024
CRYPTOMERIA LABS PTE. LTD.