Ulat sa Balita Teknolohiya
Marso 15, 2023

GPT-4 Maaaring Pangasiwaan ang Iyong Mga Kahilingan para sa Mga Larawan, Dokumento, Diagram, at Screenshot

Sa madaling sabi

GPT-4 maaaring pangasiwaan ang mga kahilingan para sa mga larawan, dokumento, diagram, at screenshot. Ito ay isang pagpapabuti sa paglipas GPT-3, na humawak lamang ng text.

GPT-4 ay may mahusay na pagganap sa iba't ibang mga pagsusulit at pagsusulit at maaaring ma-access ang karagdagang impormasyon at mga detalye sa pamamagitan ng mga larawan na maaaring hindi magagamit sa nakasulat na anyo.

gpt-4 mga larawan, mga dokumento, mga screenshot

OpenAIAng pinakabagong milestone, ang bagong modelo GPT-4, ay maaaring tumanggap ng mga kahilingan na may kasamang mga larawan, dokumentong may teksto, mga diagram, o mga screenshot bilang mga input. Ito ay kumakatawan sa isang makabuluhang pagpapabuti sa nakaraang bersyon, GPT-3, na maaari lamang maunawaan at maglabas ng teksto. Gamit ang bagong feature na ito, GPT-4 bumubuo ng mga text output na binigay ng mga input na binubuo ng interspersed text at mga imahe.

“Sa isang hanay ng mga domain—kabilang ang mga dokumentong may teksto at mga litrato, diagram, o mga screenshot—GPT-4 nagpapakita ng mga katulad na kakayahan tulad ng ginagawa nito sa mga text-only input,"

OpenAI sumulat.

ChatGPT-4 ay may mas malaking sukat kaysa sa mga nauna nito, na nagpapahiwatig na sumailalim ito sa pagsasanay sa mas malaking halaga ng data at naglalaman ng mas maraming timbang sa file ng modelo nito, na nagreresulta sa mas mataas na gastos para sa pagpapatakbo nito. Ang pinakabagong wika ng AI ay maaaring makabuo ng tekstong tulad ng tao sa pamamagitan ng paggamit malalim na pag-aaral at pagiging pre-trained sa isang malaking dataset.

GPT-4 ay nagpakita ng mahusay na pagganap kaysa sa iba pang mga wika ng AI sa iba't ibang pagsusulit at pagsusulit dahil sa kakayahan nitong mag-access ng karagdagang impormasyon at mga detalye sa pamamagitan ng mga larawang maaaring hindi available sa nakasulat na anyo.

Ang bagong GPT-4 maaaring sabihin sa iyo ng modelo kung ano ang eksaktong inilalarawan sa ilustrasyon, pag-aralan ito, at ipaliwanag pa nga ang kahulugan nito. Sa demo, GPT-4 ipinaliwanag ang visual joke kung saan ang isang VGA cable ay konektado sa iPhone. Maaari rin nitong ipaliwanag kung ano ang hindi karaniwan sa isang larawang nagpapakita ng "matinding pamamalantsa," na maaari mong tingnan sa ibaba.

gpt-4 imahe
Source: OpenAI

Gayunpaman, mayroon ding mga mas kapaki-pakinabang na implikasyon sa GPT-4bagong kaalaman ni. Sa presentasyon, ipinakita na masasabi ng PGT-4 kung ano ang maaaring lutuin mula sa mga sangkap na ipinapakita sa larawan. Nangangahulugan ito na matutulungan ka ng modelo na magluto kung mayroon kang mga produktong pagkain at walang ideya kung ano ang gagawin sa mga ito. Kumuha ng snapshot ng pagkain na mayroon ka, at Chat-GPT maaaring sabihin sa iyo kung ano ang maaari mong ihanda mula sa mga sangkap na mayroon ka sa bahay.

Ang kakayahang maunawaan at bigyang-kahulugan ang visual na impormasyon ay gumagawa GPT-4 isang makapangyarihang tool para sa mga gawain tulad ng pag-caption ng larawan, visual na pagsagot sa tanong, at kahit na paggawa ng content. Sa pagsasama ng parehong teksto at visual na pag-unawa, GPT-4 ay may potensyal na baguhin ang iba't ibang mga industriya, tulad ng advertising, disenyo, at e-commerce, at tulungan ang mga tao na gawin ang mga nakakainip, makamundong gawain para sa kanila.

Ang advance modelo ng wika 'naiintindihan' din ang mga screenshot at dokumento na may teksto, mga talahanayan, diagram, o iba pang visual na representasyon. Halimbawa, kung nag-upload ka ng tatlong-pahinang papel sa pananaliksik at kailangan itong buod at ipaliwanag, GPT-4 ay may kakayahang gawin ito. 

Ang anchor ng Bloomberg na si Jon Erlichman ay nagpakita kung paano niya nagawang baguhin ang isang hand-sketched na disenyo sa isang functional na website.

Ang bagong teknolohiya ay maaari ding gamitin bilang isang mobility aid dahil maaari itong gamitin upang ilarawan ang kapaligiran para sa mga taong may kapansanan sa paningin. Sa layuning ito, ang Open AI ay nakipagsosyo na sa isang application na tinatawag Maging ang aking mga mata na idinisenyo upang bigyan ang mga bulag ng tulong kapag kailangan nilang tingnan ang isang bagay, halimbawa, habang namimili ng grocery. Ang app ay nagbibigay-daan sa "mga boluntaryo at propesyonal na may nakikitang paningin upang malutas ang mga gawaing malaki at maliit upang tulungan ang mga taong bulag at mahina ang paningin na mamuhay ng mas malayang buhay." Ngayon, nag-aalok din ito ng isang virtual na tool na boluntaryo na pinapagana ng OpenAINi GPT-4.

Bagaman OpenAINi GPT-4 kasalukuyang nag-aalok ng kakayahang magproseso ng teksto at mga imahe bilang mga input, ang modelo ay hindi pa nasangkapan upang mahawakan ang mga input ng audio at video. Gayunpaman, may mga indikasyon na maaaring isama ang mga modalidad na ito sa susunod na pag-ulit ng teknolohiya.

Magbasa nang higit pa:

Pagtanggi sa pananagutan

Sa linya na may Mga alituntunin ng Trust Project, pakitandaan na ang impormasyong ibinigay sa pahinang ito ay hindi nilayon at hindi dapat bigyang-kahulugan bilang legal, buwis, pamumuhunan, pananalapi, o anumang iba pang paraan ng payo. Mahalagang mamuhunan lamang kung ano ang maaari mong mawala at humingi ng independiyenteng payo sa pananalapi kung mayroon kang anumang mga pagdududa. Para sa karagdagang impormasyon, iminumungkahi naming sumangguni sa mga tuntunin at kundisyon pati na rin sa mga pahina ng tulong at suporta na ibinigay ng nagbigay o advertiser. MetaversePost ay nakatuon sa tumpak, walang pinapanigan na pag-uulat, ngunit ang mga kondisyon ng merkado ay maaaring magbago nang walang abiso.

Tungkol sa Ang May-akda

Si Agne ay isang mamamahayag na sumasaklaw sa pinakabagong mga uso at pag-unlad sa metaverse, AI, at Web3 mga industriya para sa Metaverse Post. Ang kanyang hilig sa pagkukuwento ay nagbunsod sa kanya na magsagawa ng maraming panayam sa mga eksperto sa mga larangang ito, na laging naghahangad na tumuklas ng mga kapana-panabik at nakakaakit na mga kuwento. Si Agne ay mayroong Bachelor's degree sa panitikan at may malawak na background sa pagsulat tungkol sa malawak na hanay ng mga paksa kabilang ang paglalakbay, sining, at kultura. Nagboluntaryo din siya bilang isang editor para sa organisasyon ng mga karapatang panghayop, kung saan tumulong siya na itaas ang kamalayan tungkol sa mga isyu sa kapakanan ng hayop. Makipag-ugnayan sa kanya sa [protektado ng email].

Mas marami pang artikulo
Agne Cimerman
Agne Cimerman

Si Agne ay isang mamamahayag na sumasaklaw sa pinakabagong mga uso at pag-unlad sa metaverse, AI, at Web3 mga industriya para sa Metaverse Post. Ang kanyang hilig sa pagkukuwento ay nagbunsod sa kanya na magsagawa ng maraming panayam sa mga eksperto sa mga larangang ito, na laging naghahangad na tumuklas ng mga kapana-panabik at nakakaakit na mga kuwento. Si Agne ay mayroong Bachelor's degree sa panitikan at may malawak na background sa pagsulat tungkol sa malawak na hanay ng mga paksa kabilang ang paglalakbay, sining, at kultura. Nagboluntaryo din siya bilang isang editor para sa organisasyon ng mga karapatang panghayop, kung saan tumulong siya na itaas ang kamalayan tungkol sa mga isyu sa kapakanan ng hayop. Makipag-ugnayan sa kanya sa [protektado ng email].

Hot Stories

BRICS Nations Eye Stablecoin Trade Solution

by Viktoriia Palchik
Mayo 01, 2024
Sumali sa Aming Newsletter.
Pinakabagong Balita

Dumating na ang Araw ng Pagsentensiya: Ang Kapalaran ni CZ ay Nagbabalanse habang Isinasaalang-alang ng Korte ng US ang Panawagan ng DOJ

Si Changpeng Zhao ay handang harapin ang sentensiya sa korte ng US sa Seattle ngayon.

Malaman Higit Pa

Ang Mga Tagapagtatag ng Samourai Wallet ay Inakusahan na Nagpapadali ng $2B sa Darknet Deals

Ang pangamba ng mga tagapagtatag ng Samourai Wallet ay kumakatawan sa isang kapansin-pansing pag-urong para sa industriya, na binibigyang-diin ang patuloy na ...

Malaman Higit Pa
Sumali sa Aming Innovative Tech Community
Magbasa Pa
Magbasa nang higit pa
Nakipagtulungan ang Ankr Sa AI Blockchain Platform Talus Network Upang I-unlock ang Bitcoin Liquidity Para sa AI
Negosyo Ulat sa Balita Teknolohiya
Nakipagtulungan ang Ankr Sa AI Blockchain Platform Talus Network Upang I-unlock ang Bitcoin Liquidity Para sa AI
Mayo 1, 2024
Sinusuportahan ng Binance Labs ang Movement Labs Upang Pangasiwaan ang Pagsasama-sama ng Facebook sa Mga Blockchain
Negosyo Ulat sa Balita Teknolohiya
Sinusuportahan ng Binance Labs ang Movement Labs Upang Pangasiwaan ang Pagsasama-sama ng Facebook sa Mga Blockchain
Mayo 1, 2024
BRICS Nations Eye Stablecoin Trade Solution
Negosyo markets Mga Kuwento at Pagsusuri Teknolohiya
BRICS Nations Eye Stablecoin Trade Solution
Mayo 1, 2024
Bitcoin L2 Network BOB Sumasama Sa LayerZero Para sa Pinahusay na Paggana
Negosyo Ulat sa Balita Teknolohiya
Bitcoin L2 Network BOB Sumasama Sa LayerZero Para sa Pinahusay na Paggana
Mayo 1, 2024
CRYPTOMERIA LABS PTE. LTD.