Uudiste reportaaž Tehnoloogia
Märtsil 15, 2023

GPT-4 Saab hakkama teie piltide, dokumentide, diagrammide ja ekraanipiltide taotlustega

Põgusalt

GPT-4 saab käsitleda piltide, dokumentide, diagrammide ja ekraanipiltide taotlusi. See on edasiminek GPT-3, mis käsitles ainult teksti.

GPT-4 omab suurepäraseid tulemusi erinevatel eksamitel ja testidel ning pääseb juurde lisateabele ja üksikasjadele piltide kaudu, mis ei pruugi olla kirjalikul kujul saadaval.

gpt-4 piltide dokumentide ekraanipildid

OpenAIuusim verstapost, uus mudel GPT-4, saab vastu võtta taotlusi, mis sisaldavad sisenditena pilte, tekstiga dokumente, diagramme või ekraanipilte. See on märkimisväärne edasiminek võrreldes eelmise versiooniga, GPT-3, mis sai aru ja väljastada ainult teksti. Selle uue funktsiooniga GPT-4 genereerib tekstiväljundeid antud sisenditega, mis koosnevad segatud tekstist ja piltidest.

„Erinevates valdkondades – sealhulgas teksti ja fotodega dokumendid, diagrammid või ekraanipildid –GPT-4 sellel on sarnased võimalused nagu ainult tekstisisendite puhul.

OpenAI kirjutas.

ChatGPT-4 on eelkäijatest suurem, mis näitab, et see on läbinud koolituse suuremal hulgal andmetel ja sisaldab mudelifailis rohkem kaalu, mille tulemuseks on selle töö kallim. Uusim tehisintellekti keel suudab selle abil luua inimesesarnast teksti sügav õpe ja suure andmehulga osas eelkoolitus.

GPT-4 on näitas paremat jõudlust võrreldes teiste AI keeltega mitmesugustel eksamitel ja testidel, mis on osaliselt tingitud selle võimalusest pääseda juurde täiendavale teabele ja üksikasjadele piltide kaudu, mis ei pruugi olla kirjalikul kujul saadaval.

Uus GPT-4 mudel võib teile öelda, mida illustratsioonil täpselt kujutatakse, analüüsida seda ja isegi selgitada selle tähendust. Demos GPT-4 selgitas visuaalset nalja, kus VGA-kaabel on iPhone'iga ühendatud. Samuti võib see selgitada, mis on ebatavalist pildil, mis kujutab "äärmuslikku triikimist", mida saate allpool vaadata.

gpt-4 pildid
Allikas: OpenAI

Siiski on sellel ka rohkem kasulikke tagajärgi GPT-4uued teadmised. Esitluses näidati, et PGT-4 oskab öelda, mida pildil näidatud koostisosadest valmistada saab. See tähendab, et mudel aitab teil süüa teha, kui teil on toiduaineid ja teil pole aimugi, mida nendega teha. Tehke oma toidust hetkepilt ja vestelgeGPT oskab öelda, mida saate kodus olemasolevatest koostisosadest valmistada.

See visuaalse teabe mõistmise ja tõlgendamise võime muudab GPT-4 võimas tööriist selliste ülesannete jaoks nagu piltide pealdised, visuaalne küsimustele vastamine ja isegi sisu loomine. Nii teksti kui ka visuaalse mõistmise integreerimisega GPT-4 sellel on potentsiaal muuta revolutsiooniliseks mitmed tööstusharud, nagu reklaam, disain ja e-kaubandus, ning aidata inimestel teha nende eest igavaid ja igapäevaseid ülesandeid.

Täiustatud keelemudel mõistab ka ekraanipilte ja teksti, tabelite, diagrammide või muude visuaalsete kujutistega dokumente. Näiteks kui laadite üles kolmeleheküljelise uurimistöö ja vajate sellest kokkuvõtet ja selgitust, GPT-4 on selleks võimeline. 

Bloombergi ankur Jon Erlichman demonstreeris, kuidas ta suutis muuta käsitsi visandatud kujunduse funktsionaalseks veebisaidiks.

Uut tehnoloogiat saab kasutada ka liikumisabivahendina, kuna seda saab kasutada nägemispuudega inimeste keskkonna kirjeldamiseks. Selleks on Open AI juba teinud koostööd rakendusega nimega Ole mu silmad mis on loodud selleks, et anda pimedatele abikäsi, kui neil on vaja näiteks toidupoes ostes midagi vaadata. Rakendus võimaldab "nägevatel vabatahtlikel ja spetsialistidel silmad ette lasta suurte ja väikeste ülesannete lahendamiseks, et aidata pimedatel ja vaegnägijatel iseseisvamalt elada." Nüüd pakub see ka virtuaalset vabatahtlike tööriista, mida toidab OpenAI'S GPT-4.

Kuigi OpenAI'S GPT-4 pakub praegu võimalust töödelda teksti ja pilte sisenditena, mudel ei ole veel varustatud heli- ja videosisendite käsitlemiseks. Sellegipoolest on viiteid sellele, et need meetodid võivad sisalduda tehnoloogia järgmises iteratsioonis.

Loe rohkem:

Kaebused

Vastavalt Usaldusprojekti juhised, pange tähele, et sellel lehel esitatud teave ei ole mõeldud ega tohiks tõlgendada kui juriidilist, maksu-, investeerimis-, finants- või muud nõuannet. Oluline on investeerida ainult seda, mida saate endale lubada kaotada, ja kahtluste korral küsida sõltumatut finantsnõu. Lisateabe saamiseks soovitame vaadata nõudeid ja tingimusi ning väljaandja või reklaamija pakutavaid abi- ja tugilehti. MetaversePost on pühendunud täpsele ja erapooletule aruandlusele, kuid turutingimusi võidakse ette teatamata muuta.

Umbes Autor

Agne on ajakirjanik, kes kajastab uusimaid trende ja arenguid metaversumis, AI-s ja Web3 tööstused Metaverse Post. Tema kirg lugude jutustamise vastu on viinud ta andma arvukalt intervjuusid nende valdkondade ekspertidega, püüdes alati avastada põnevaid ja kaasahaaravaid lugusid. Agnel on bakalaureusekraad kirjanduses ja tal on laialdane taust kirjutamisel väga erinevatel teemadel, sealhulgas reisimine, kunst ja kultuur. Ta on olnud ka vabatahtlik toimetaja loomaõiguste organisatsioonis, kus ta aitas tõsta teadlikkust loomade heaolu küsimustest. Võtke temaga ühendust [meiliga kaitstud].

Veel artikleid
Agne Cimerman
Agne Cimerman

Agne on ajakirjanik, kes kajastab uusimaid trende ja arenguid metaversumis, AI-s ja Web3 tööstused Metaverse Post. Tema kirg lugude jutustamise vastu on viinud ta andma arvukalt intervjuusid nende valdkondade ekspertidega, püüdes alati avastada põnevaid ja kaasahaaravaid lugusid. Agnel on bakalaureusekraad kirjanduses ja tal on laialdane taust kirjutamisel väga erinevatel teemadel, sealhulgas reisimine, kunst ja kultuur. Ta on olnud ka vabatahtlik toimetaja loomaõiguste organisatsioonis, kus ta aitas tõsta teadlikkust loomade heaolu küsimustest. Võtke temaga ühendust [meiliga kaitstud].

Hot Stories
Liituge meie uudiskirjaga.
Uudised

Karistuspäev saabub: CZ saatus on tasakaalus, kuna USA kohus võtab DOJ palvet arvesse

Changpeng Zhao ootab täna ees kohtuotsus USA Seattle'i kohtus.

Rohkem teada

Samourai rahakoti asutajaid süüdistatakse Darkneti tehingute 2 miljardi dollari suuruse hõlbustamises

Samourai Walleti asutajate kartus on tööstuse jaoks märkimisväärne tagasilöök, mis rõhutab püsivat ...

Rohkem teada
Liituge meie uuendusliku tehnikakogukonnaga
Loe rohkem
Loe edasi
AI renessanss mänguarenduses 2024. aastal
AI Wiki Metaverse Wiki Käsitöö turud tarkvara Tehnoloogia
AI renessanss mänguarenduses 2024. aastal
Võib 1 2024
Estée Lauderi uus tehisintellekti innovatsioonilabor: lähemalt, kuidas generatiivne AI muudab ilubrände
Elustiil tarkvara Lood ja ülevaated Tehnoloogia
Estée Lauderi uus tehisintellekti innovatsioonilabor: lähemalt, kuidas generatiivne AI muudab ilubrände
Võib 1 2024
Chainlink ja kiire lisamine teevad koostööd CCIP-põhise plokiahelaadapteri väljatöötamiseks
Äri Uudiste reportaaž Tehnoloogia
Chainlink ja kiire lisamine teevad koostööd CCIP-põhise plokiahelaadapteri väljatöötamiseks
Võib 1 2024
BitSmiley toob turule Alphanet V1, debüüdi Bitcoini kihi 2 võrgu bitikihis
Uudiste reportaaž Tehnoloogia
BitSmiley toob turule Alphanet V1, debüüdi Bitcoini kihi 2 võrgu bitikihis
Võib 1 2024
CRYPTOMERIA LABS PTE. LTD.