GPT-4 Lahko obravnava vaše zahteve za slike, dokumente, diagrame in posnetke zaslona
Na kratko
GPT-4 lahko obravnava zahteve za slike, dokumente, diagrame in posnetke zaslona. To je izboljšanje GPT-3, ki je obravnaval samo besedilo.
GPT-4 ima vrhunske rezultate pri različnih izpitih in testih ter lahko dostopa do dodatnih informacij in podrobnosti prek slik, ki morda niso na voljo v pisni obliki.
OpenAInajnovejši mejnik, novi model GPT-4, lahko sprejme zahteve, ki vključujejo slike, dokumente z besedilom, diagrame ali posnetke zaslona kot vnose. To predstavlja znatno izboljšavo v primerjavi s prejšnjo različico, GPT-3, ki je lahko samo razumel in izpisal besedilo. S to novo funkcijo, GPT-4 ustvari besedilne izhode glede na vnose, sestavljene iz vmesnega besedila in slik.
»Na različnih področjih – vključno z dokumenti z besedilom in fotografijami, diagrami ali posnetki zaslona –GPT-4 kaže podobne zmogljivosti kot pri vnosih samo besedila,«
OpenAI napisal.
ChatGPT-4 ima večjo velikost kot njegovi predhodniki, kar pomeni, da je bil podvržen usposabljanju za večjo količino podatkov in vsebuje več uteži v svoji modelni datoteki, kar ima za posledico višje stroške za njegovo delovanje. Najnovejši jezik AI lahko ustvari človeško podobno besedilo z uporabo globoko učenje in biti predhodno usposobljen za velik nabor podatkov.
GPT-4 je dokazal vrhunsko zmogljivost v primerjavi z drugimi jeziki umetne inteligence pri različnih izpitih in testih, deloma zaradi svoje zmožnosti dostopa do dodatnih informacij in podrobnosti prek slik, ki morda niso na voljo v pisni obliki.
Novi GPT-4 model vam lahko pove, kaj točno je upodobljeno na ilustraciji, ga analizira in celo razloži njegov pomen. V demo, GPT-4 razložil vizualno šalo, kjer je kabel VGA priključen na iPhone. Lahko bi tudi pojasnilo, kaj je nenavadnega na sliki, ki predstavlja "ekstremno likanje", kar si lahko ogledate spodaj.
Vendar pa obstajajo tudi bolj koristne posledice GPT-4novo pridobljeno znanje. V predstavitvi je bilo prikazano, da lahko PGT-4 pove, kaj se da skuhati iz sestavin, prikazanih na sliki. To pomeni, da vam lahko model pomaga kuhati, če imate živila in ne veste, kaj bi z njimi. Naredite posnetek hrane, ki jo imate, in poklepetajteGPT vam lahko pove, kaj lahko pripravite iz sestavin, ki jih imate doma.
Ta sposobnost razumevanja in interpretacije vizualnih informacij naredi GPT-4 zmogljivo orodje za naloge, kot so napisi za slike, vizualni odgovori na vprašanja in celo ustvarjanje vsebine. Z integracijo besedila in vizualnega razumevanja, GPT-4 ima potencial, da revolucionira različne industrije, kot so oglaševanje, oblikovanje in e-trgovina, ter pomaga ljudem opravljati dolgočasna, vsakdanja opravila namesto njih.
napredno jezikovni model prav tako 'razume' posnetke zaslona in dokumente z besedilom, tabelami, diagrami ali drugimi vizualnimi predstavitvami. Če na primer naložite tristransko raziskovalno nalogo in jo potrebujete povzeto in razloženo, GPT-4 je tega sposoben.
Bloombergov voditelj Jon Erlichman je pokazal, kako mu je uspelo preoblikovati ročno skiciran dizajn v funkcionalno spletno mesto.
Novo tehnologijo je mogoče uporabiti tudi kot pripomoček pri mobilnosti, saj bi jo lahko uporabili za opisovanje okolja za ljudi z okvarami vida. V ta namen je Open AI že sodeloval z aplikacijo, imenovano Bodite moje oči ki je bil zasnovan za pomoč slepim, ko morajo nekaj pogledati, na primer med nakupovanjem v trgovini. Aplikacija omogoča, da "vidni prostovoljci in strokovnjaki posojajo svoje oči za reševanje velikih in majhnih nalog, da bi slepim in slabovidnim pomagali živeti bolj neodvisno življenje." Zdaj ponuja tudi virtualno orodje za prostovoljce, ki ga poganja OpenAIJe GPT-4.
Čeprav OpenAIJe GPT-4 trenutno ponuja možnost obdelave besedila in slik kot vhodov, model še ni opremljen za obdelavo avdio in video vhodov. Kljub temu obstajajo znaki, da bi te modalitete lahko vključili v naslednjo ponovitev tehnologije.
Preberite več:
- Top 7 podjetij, ki so sprejela GPT-4
- GPT-4-Temelji ChatGPT Presega GPT-3 s faktorjem 570
- Microsoft potrjuje, da Bing deluje na napredni napravi GPT-4 Model
- GPT-4 vs GPT-3: Kaj ponuja novi model?
Zavrnitev odgovornosti
V skladu z Smernice projekta Trust, upoštevajte, da informacije na tej strani niso namenjene in se jih ne sme razlagati kot pravni, davčni, naložbeni, finančni ali kakršen koli drug nasvet. Pomembno je, da vlagate samo tisto, kar si lahko privoščite izgubiti, in da poiščete neodvisen finančni nasvet, če imate kakršne koli dvome. Za dodatne informacije predlagamo, da si ogledate določila in pogoje ter strani s pomočjo in podporo, ki jih nudi izdajatelj ali oglaševalec. MetaversePost se zavzema za natančno in nepristransko poročanje, vendar se tržni pogoji lahko spremenijo brez predhodnega obvestila.
O avtorju
Agne je novinarka, ki pokriva najnovejše trende in razvoj v metaverzumu, AI in Web3 industrije za Metaverse Post. Njena strast do pripovedovanja zgodb jo je pripeljala do številnih intervjujev s strokovnjaki s teh področij, pri čemer si je vedno prizadevala odkriti vznemirljive in privlačne zgodbe. Agne je diplomirala iz književnosti in ima obsežno znanje pisanja o številnih temah, vključno s potovanji, umetnostjo in kulturo. Bila je tudi prostovoljka urednica organizacije za pravice živali, kjer je pomagala ozaveščati o vprašanjih dobrega počutja živali. Kontaktirajte jo na [e-pošta zaščitena].
več člankovAgne je novinarka, ki pokriva najnovejše trende in razvoj v metaverzumu, AI in Web3 industrije za Metaverse Post. Njena strast do pripovedovanja zgodb jo je pripeljala do številnih intervjujev s strokovnjaki s teh področij, pri čemer si je vedno prizadevala odkriti vznemirljive in privlačne zgodbe. Agne je diplomirala iz književnosti in ima obsežno znanje pisanja o številnih temah, vključno s potovanji, umetnostjo in kulturo. Bila je tudi prostovoljka urednica organizacije za pravice živali, kjer je pomagala ozaveščati o vprašanjih dobrega počutja živali. Kontaktirajte jo na [e-pošta zaščitena].