GPT-4 Može obraditi vaše zahtjeve za slike, dokumente, dijagrame i snimke zaslona
Ukratko
GPT-4 može obraditi zahtjeve za slike, dokumente, dijagrame i snimke zaslona. To je poboljšanje u odnosu na GPT-3, koji je obrađivao samo tekst.
GPT-4 ima vrhunske rezultate na raznim ispitima i testovima te može pristupiti dodatnim informacijama i detaljima putem slika koje možda nisu dostupne u pisanom obliku.
OpenAIposljednja prekretnica, novi model GPT-4, može prihvatiti zahtjeve koji uključuju slike, dokumente s tekstom, dijagrame ili snimke zaslona kao unose. Ovo predstavlja značajno poboljšanje u odnosu na prethodnu verziju, GPT-3, koji je mogao samo razumjeti i ispisati tekst. S ovom novom značajkom, GPT-4 generira tekstualne izlaze s obzirom na ulaze koji se sastoje od isprepletenog teksta i slika.
“Na nizu domena—uključujući dokumente s tekstom i fotografijama, dijagrame ili snimke zaslona—GPT-4 pokazuje slične mogućnosti kao i kod unosa samo teksta,"
OpenAI napisao.
ChatGPT-4 ima veću veličinu od svojih prethodnika, što ukazuje na to da je prošao obuku na većoj količini podataka i sadrži više težina u svojoj datoteci modela, što je rezultiralo višim troškovima za njegov rad. Najnoviji AI jezik može generirati tekst sličan ljudskom pomoću duboko učenje i biti prethodno obučen na velikom skupu podataka.
GPT-4 ima pokazao superiorne performanse u odnosu na druge AI jezike u raznim ispitima i testovima zahvaljujući djelomično njegovoj mogućnosti pristupa dodatnim informacijama i detaljima putem slika koje možda nisu dostupne u pisanom obliku.
Novo GPT-4 model vam može reći što je točno prikazano na ilustraciji, analizirati to, pa čak i objasniti njegovo značenje. U demonstraciji, GPT-4 objasnio vizualni vic gdje se VGA kabel spaja na iPhone. To bi također moglo objasniti što je neobično na slici koja prikazuje "ekstremno peglanje", a koju možete pogledati u nastavku.
Međutim, postoje i korisnije implikacije GPT-4novootkriveno znanje. U prezentaciji je pokazano da PGT-4 može reći što se može skuhati od sastojaka prikazanih na slici. To znači da vam model može pomoći u kuhanju ako imate prehrambene proizvode, a ne znate što s njima. Snimite hranu koju imate i razgovarajteGPT može vam reći što možete pripremiti od sastojaka koje imate kod kuće.
Ova sposobnost razumijevanja i tumačenja vizualnih informacija čini GPT-4 moćan alat za zadatke kao što su opisi slika, vizualni odgovori na pitanja, pa čak i stvaranje sadržaja. Uz integraciju teksta i vizualnog razumijevanja, GPT-4 ima potencijal revolucionirati razne industrije, poput oglašavanja, dizajna i e-trgovine, i pomoći ljudima da obavljaju dosadne, svakodnevne zadatke umjesto njih.
Napredni jezični model također 'razumije' snimke zaslona i dokumente s tekstom, tablicama, dijagramima ili drugim vizualnim prikazima. Na primjer, ako učitate istraživački rad od tri stranice i trebate ga sažeti i objasniti, GPT-4 je sposoban to učiniti.
Bloombergov voditelj Jon Erlichman pokazao je kako je uspio transformirati ručno skicirani dizajn u funkcionalnu web stranicu.
Nova tehnologija također se može koristiti kao pomoć pri kretanju jer bi se mogla koristiti za opisivanje okoliša za osobe oštećena vida. U tu je svrhu Open AI već sklopio partnerstvo s aplikacijom pod nazivom Budi moje oči koji je osmišljen kako bi slijepim osobama pružio ruku pomoći kada trebaju nešto pogledati, na primjer, dok kupuju namirnice. Aplikacija omogućuje "videćim volonterima i profesionalcima da posude svoje oči za rješavanje velikih i malih zadataka kako bi pomogli slijepim i slabovidnim osobama da vode neovisniji život." Sada nudi i virtualni volonterski alat koji pokreće OpenAI'S GPT-4.
Iako OpenAI'S GPT-4 trenutno nudi mogućnost obrade teksta i slika kao ulaza, model još nije opremljen za rukovanje audio i video ulazima. Unatoč tome, postoje naznake da bi ti modaliteti mogli biti uključeni u sljedeću iteraciju tehnologije.
Pročitajte više:
- Top 7 tvrtki koje su usvojile GPT-4
- GPT-4-Na osnovi ChatGPT nadmašuje GPT-3 faktorom 570
- Microsoft potvrđuje da Bing radi na Advanced GPT-4 Model
- GPT-4 vs GPT-3: Što novi model ima za ponuditi?
Izjava o odricanju od odgovornosti
U skladu s Smjernice projekta povjerenja, imajte na umu da informacije navedene na ovoj stranici nemaju namjeru i ne smiju se tumačiti kao pravni, porezni, investicijski, financijski ili bilo koji drugi oblik savjeta. Važno je ulagati samo ono što si možete priuštiti izgubiti i potražiti neovisni financijski savjet ako imate bilo kakvih nedoumica. Za dodatne informacije predlažemo da pogledate odredbe i uvjete, kao i stranice za pomoć i podršku koje pruža izdavatelj ili oglašivač. MetaversePost je predan točnom, nepristranom izvješćivanju, ali tržišni uvjeti podložni su promjenama bez prethodne najave.
O autoru
Agne je novinarka koja pokriva najnovije trendove i razvoj u metaverzumu, umjetnoj inteligenciji i Web3 industrije za Metaverse Post. Njezina strast za pripovijedanjem dovela ju je do brojnih intervjua sa stručnjacima u tim područjima, uvijek nastojeći otkriti uzbudljive i privlačne priče. Agne je diplomirala književnost i ima opsežno iskustvo u pisanju o širokom rasponu tema, uključujući putovanja, umjetnost i kulturu. Također je volontirala kao urednica organizacije za prava životinja, gdje je pomogla u podizanju svijesti o pitanjima dobrobiti životinja. Kontaktirajte je na [e-pošta zaštićena].
Više članakaAgne je novinarka koja pokriva najnovije trendove i razvoj u metaverzumu, umjetnoj inteligenciji i Web3 industrije za Metaverse Post. Njezina strast za pripovijedanjem dovela ju je do brojnih intervjua sa stručnjacima u tim područjima, uvijek nastojeći otkriti uzbudljive i privlačne priče. Agne je diplomirala književnost i ima opsežno iskustvo u pisanju o širokom rasponu tema, uključujući putovanja, umjetnost i kulturu. Također je volontirala kao urednica organizacije za prava životinja, gdje je pomogla u podizanju svijesti o pitanjima dobrobiti životinja. Kontaktirajte je na [e-pošta zaštićena].