Novice Tehnologija
Marec 15, 2023

GPT-4 Lahko obravnava vaše zahteve za slike, dokumente, diagrame in posnetke zaslona

Na kratko

GPT-4 lahko obravnava zahteve za slike, dokumente, diagrame in posnetke zaslona. To je izboljšanje GPT-3, ki je obravnaval samo besedilo.

GPT-4 ima vrhunske rezultate pri različnih izpitih in testih ter lahko dostopa do dodatnih informacij in podrobnosti prek slik, ki morda niso na voljo v pisni obliki.

gpt-4 slike dokumenti posnetki zaslona

OpenAInajnovejši mejnik, novi model GPT-4, lahko sprejme zahteve, ki vključujejo slike, dokumente z besedilom, diagrame ali posnetke zaslona kot vnose. To predstavlja znatno izboljšavo v primerjavi s prejšnjo različico, GPT-3, ki je lahko samo razumel in izpisal besedilo. S to novo funkcijo, GPT-4 ustvari besedilne izhode glede na vnose, sestavljene iz vmesnega besedila in slik.

»Na različnih področjih – vključno z dokumenti z besedilom in fotografijami, diagrami ali posnetki zaslona –GPT-4 kaže podobne zmogljivosti kot pri vnosih samo besedila,«

OpenAI napisal.

ChatGPT-4 ima večjo velikost kot njegovi predhodniki, kar pomeni, da je bil podvržen usposabljanju za večjo količino podatkov in vsebuje več uteži v svoji modelni datoteki, kar ima za posledico višje stroške za njegovo delovanje. Najnovejši jezik AI lahko ustvari človeško podobno besedilo z uporabo globoko učenje in biti predhodno usposobljen za velik nabor podatkov.

GPT-4 je dokazal vrhunsko zmogljivost v primerjavi z drugimi jeziki umetne inteligence pri različnih izpitih in testih, deloma zaradi svoje zmožnosti dostopa do dodatnih informacij in podrobnosti prek slik, ki morda niso na voljo v pisni obliki.

Novi GPT-4 model vam lahko pove, kaj točno je upodobljeno na ilustraciji, ga analizira in celo razloži njegov pomen. V demo, GPT-4 razložil vizualno šalo, kjer je kabel VGA priključen na iPhone. Lahko bi tudi pojasnilo, kaj je nenavadnega na sliki, ki predstavlja "ekstremno likanje", kar si lahko ogledate spodaj.

gpt-4 slike
vir: OpenAI

Vendar pa obstajajo tudi bolj koristne posledice GPT-4novo pridobljeno znanje. V predstavitvi je bilo prikazano, da lahko PGT-4 pove, kaj se da skuhati iz sestavin, prikazanih na sliki. To pomeni, da vam lahko model pomaga kuhati, če imate živila in ne veste, kaj bi z njimi. Naredite posnetek hrane, ki jo imate, in poklepetajteGPT vam lahko pove, kaj lahko pripravite iz sestavin, ki jih imate doma.

Ta sposobnost razumevanja in interpretacije vizualnih informacij naredi GPT-4 zmogljivo orodje za naloge, kot so napisi za slike, vizualni odgovori na vprašanja in celo ustvarjanje vsebine. Z integracijo besedila in vizualnega razumevanja, GPT-4 ima potencial, da revolucionira različne industrije, kot so oglaševanje, oblikovanje in e-trgovina, ter pomaga ljudem opravljati dolgočasna, vsakdanja opravila namesto njih.

napredno jezikovni model prav tako 'razume' posnetke zaslona in dokumente z besedilom, tabelami, diagrami ali drugimi vizualnimi predstavitvami. Če na primer naložite tristransko raziskovalno nalogo in jo potrebujete povzeto in razloženo, GPT-4 je tega sposoben. 

Bloombergov voditelj Jon Erlichman je pokazal, kako mu je uspelo preoblikovati ročno skiciran dizajn v funkcionalno spletno mesto.

Novo tehnologijo je mogoče uporabiti tudi kot pripomoček pri mobilnosti, saj bi jo lahko uporabili za opisovanje okolja za ljudi z okvarami vida. V ta namen je Open AI že sodeloval z aplikacijo, imenovano Bodite moje oči ki je bil zasnovan za pomoč slepim, ko morajo nekaj pogledati, na primer med nakupovanjem v trgovini. Aplikacija omogoča, da "vidni prostovoljci in strokovnjaki posojajo svoje oči za reševanje velikih in majhnih nalog, da bi slepim in slabovidnim pomagali živeti bolj neodvisno življenje." Zdaj ponuja tudi virtualno orodje za prostovoljce, ki ga poganja OpenAIJe GPT-4.

Čeprav OpenAIJe GPT-4 trenutno ponuja možnost obdelave besedila in slik kot vhodov, model še ni opremljen za obdelavo avdio in video vhodov. Kljub temu obstajajo znaki, da bi te modalitete lahko vključili v naslednjo ponovitev tehnologije.

Preberite več:

Zavrnitev odgovornosti

V skladu z Smernice projekta Trust, upoštevajte, da informacije na tej strani niso namenjene in se jih ne sme razlagati kot pravni, davčni, naložbeni, finančni ali kakršen koli drug nasvet. Pomembno je, da vlagate samo tisto, kar si lahko privoščite izgubiti, in da poiščete neodvisen finančni nasvet, če imate kakršne koli dvome. Za dodatne informacije predlagamo, da si ogledate določila in pogoje ter strani s pomočjo in podporo, ki jih nudi izdajatelj ali oglaševalec. MetaversePost se zavzema za natančno in nepristransko poročanje, vendar se tržni pogoji lahko spremenijo brez predhodnega obvestila.

O avtorju

Agne je novinarka, ki pokriva najnovejše trende in razvoj v metaverzumu, AI in Web3 industrije za Metaverse Post. Njena strast do pripovedovanja zgodb jo je pripeljala do številnih intervjujev s strokovnjaki s teh področij, pri čemer si je vedno prizadevala odkriti vznemirljive in privlačne zgodbe. Agne je diplomirala iz književnosti in ima obsežno znanje pisanja o številnih temah, vključno s potovanji, umetnostjo in kulturo. Bila je tudi prostovoljka urednica organizacije za pravice živali, kjer je pomagala ozaveščati o vprašanjih dobrega počutja živali. Kontaktirajte jo na [e-pošta zaščitena].

več člankov
Agne Cimerman
Agne Cimerman

Agne je novinarka, ki pokriva najnovejše trende in razvoj v metaverzumu, AI in Web3 industrije za Metaverse Post. Njena strast do pripovedovanja zgodb jo je pripeljala do številnih intervjujev s strokovnjaki s teh področij, pri čemer si je vedno prizadevala odkriti vznemirljive in privlačne zgodbe. Agne je diplomirala iz književnosti in ima obsežno znanje pisanja o številnih temah, vključno s potovanji, umetnostjo in kulturo. Bila je tudi prostovoljka urednica organizacije za pravice živali, kjer je pomagala ozaveščati o vprašanjih dobrega počutja živali. Kontaktirajte jo na [e-pošta zaščitena].

Hot Stories
Pridružite se našemu glasilu.
Zadnje novice

Prihaja dan obsodbe: usoda CZ visi na ravnovesju, ko ameriško sodišče obravnava tožbeni razlog DOJ

Changpeng Zhao se danes sooča z obsodbo na ameriškem sodišču v Seattlu.

Več o tem

Ustanovitelji denarnice Samourai Wallet obtoženi omogočanja 2 milijard dolarjev pri poslih Darknet

Zaskrbljenost ustanoviteljev denarnice Samourai Wallet predstavlja opazno nazadovanje za industrijo, ki poudarja vztrajno ...

Več o tem
Pridružite se naši inovativni tehnološki skupnosti
Preberi več
Preberi več
Ankr sodeluje s platformo AI Blockchain Talus Network za odklepanje likvidnosti bitcoinov za AI
ŽELITE POSTATI PARTNER Novice Tehnologija
Ankr sodeluje s platformo AI Blockchain Talus Network za odklepanje likvidnosti bitcoinov za AI
Maj 1, 2024
Binance Labs podpira Movement Labs, da bi olajšal Facebookovo integracijo Move v verigah blokov
ŽELITE POSTATI PARTNER Novice Tehnologija
Binance Labs podpira Movement Labs, da bi olajšal Facebookovo integracijo Move v verigah blokov
Maj 1, 2024
BRICS Nations Eye Rešitev za trgovanje s stabilnimi kovanci
ŽELITE POSTATI PARTNER Prisotnost Zgodbe in ocene Tehnologija
BRICS Nations Eye Rešitev za trgovanje s stabilnimi kovanci
Maj 1, 2024
Bitcoin L2 omrežje BOB se integrira z LayerZero za izboljšano funkcionalnost
ŽELITE POSTATI PARTNER Novice Tehnologija
Bitcoin L2 omrežje BOB se integrira z LayerZero za izboljšano funkcionalnost
Maj 1, 2024
CRYPTOMERIA LABS PTE. LTD.