Naujienų ataskaita Technologija
Kovo 15, 2023

GPT-4 Gali tvarkyti jūsų užklausas dėl vaizdų, dokumentų, diagramų ir ekrano kopijų

Trumpai

GPT-4 gali apdoroti užklausas dėl vaizdų, dokumentų, diagramų ir ekrano kopijų. Tai pagerėjimas GPT-3, kuris tvarkė tik tekstą.

GPT-4 pasižymi puikiu našumu atliekant įvairius egzaminus ir testus ir gali pasiekti papildomos informacijos bei išsamios informacijos per vaizdus, ​​kurių gali nebūti raštu.

gpt-4 vaizdų dokumentų ekrano kopijos

OpenAInaujausias įvykis – naujas modelis GPT-4, gali priimti užklausas, kuriose kaip įvestis yra vaizdai, dokumentai su tekstu, diagramos ar ekrano kopijos. Tai yra reikšmingas patobulinimas, palyginti su ankstesne versija, GPT-3, kuris galėjo suprasti ir išvesti tik tekstą. Su šia nauja funkcija, GPT-4 generuoja teksto išvestis, kai įvestis susideda iš įsiterpusio teksto ir vaizdų.

„Įvairiose srityse, įskaitant dokumentus su tekstu ir nuotraukomis, diagramas ar ekrano kopijas,GPT-4 pasižymi panašiomis galimybėmis, kaip ir tik teksto įvestimis“,

OpenAI parašė

ChatGPT-4 yra didesnio dydžio nei jo pirmtakai, o tai rodo, kad buvo apmokytas didesnis duomenų kiekis, o modelio faile yra daugiau svarmenų, todėl jo eksploatacija yra didesnė. Naujausia AI kalba gali generuoti į žmogų panašų tekstą naudojant gilus mokymasis ir yra iš anksto apmokytas naudoti didelį duomenų rinkinį.

GPT-4 turi pademonstravo puikų našumą, palyginti su kitomis AI kalbomis atliekant įvairius egzaminus ir testus, iš dalies dėl galimybės gauti papildomos informacijos ir detalių per vaizdus, ​​kurių gali nebūti raštu.

Nauja GPT-4 modelis gali pasakyti, kas tiksliai pavaizduota iliustracijoje, ją analizuoti ir net paaiškinti jo reikšmę. Demonstracinėje versijoje GPT-4 paaiškino vizualinį pokštą, kai prie iPhone prijungiamas VGA laidas. Tai taip pat galėtų paaiškinti, kas neįprasta paveikslėlyje, kuriame pristatomas „ypatingas lyginimas“, kurį galite peržiūrėti toliau.

gpt-4 vaizdai
šaltinis: OpenAI

Tačiau yra ir daugiau naudingų pasekmių GPT-4naujos žinios. Pristatyme buvo parodyta, kad PGT-4 gali pasakyti, ką galima virti iš paveikslėlyje pavaizduotų ingredientų. Tai reiškia, kad modelis gali padėti gaminti maistą, jei turite maisto produktų ir nežinote, ką su jais daryti. Padarykite valgio momentinę nuotrauką ir pasikalbėkiteGPT gali pasakyti, ką galite paruošti iš namuose turimų ingredientų.

Šis gebėjimas suprasti ir interpretuoti vaizdinę informaciją leidžia GPT-4 galingas įrankis tokioms užduotims kaip vaizdų antraštės, vaizdinis atsakymas į klausimus ir net turinio kūrimas. Integruojant teksto ir vaizdinį supratimą, GPT-4 gali sukelti revoliuciją įvairiose pramonės šakose, tokiose kaip reklama, dizainas ir elektroninė prekyba, ir padėti žmonėms atlikti nuobodžias, kasdienes užduotis.

Išplėstinė kalbos modelis taip pat „supranta“ ekrano kopijas ir dokumentus su tekstu, lentelėmis, diagramomis ar kitais vaizdiniais vaizdais. Pavyzdžiui, jei įkeliate trijų puslapių mokslinį darbą ir norite jį apibendrinti bei paaiškinti, GPT-4 yra pajėgus tai padaryti. 

„Bloomberg“ inkaras Jonas Erlichmanas pademonstravo, kaip sugebėjo rankomis nubrėžtą dizainą paversti funkcionalia svetaine.

Naujoji technologija taip pat gali būti naudojama kaip judėjimo priemonė, nes ji gali būti naudojama apibūdinti aplinką regos negalią turintiems žmonėms. Šiuo tikslu Open AI jau bendradarbiauja su programa, vadinama Būk mano akys kuri buvo sukurta tam, kad akliesiems ištiestų pagalbos ranką, kai jiems reikia ką nors apžiūrėti, pavyzdžiui, perkant bakalėjos prekes. Programėlė leidžia „regintiems savanoriams ir profesionalams padėti spręsti dideles ir mažas užduotis, kad padėtų akliesiems ir silpnaregiams gyventi savarankiškesnį gyvenimą“. Dabar ji taip pat siūlo virtualų savanorių įrankį, kurį maitina OpenAIS GPT-4.

nors OpenAIS GPT-4 šiuo metu siūlo galimybę apdoroti tekstą ir vaizdus kaip įvestis, modelis dar nėra aprūpintas garso ir vaizdo įvestimis. Nepaisant to, yra požymių, kad šie būdai gali būti įtraukti į kitą technologijos iteraciją.

Plačiau paskaitykite čia:

Atsakomybės neigimas

Remdamasi tuo, Pasitikėjimo projekto gairės, atkreipkite dėmesį, kad šiame puslapyje pateikta informacija nėra skirta ir neturėtų būti aiškinama kaip teisinė, mokesčių, investicinė, finansinė ar bet kokia kita konsultacija. Svarbu investuoti tik tai, ką galite sau leisti prarasti, ir, jei turite kokių nors abejonių, kreiptis į nepriklausomą finansinę konsultaciją. Norėdami gauti daugiau informacijos, siūlome peržiūrėti taisykles ir nuostatas bei pagalbos ir palaikymo puslapius, kuriuos pateikia išdavėjas arba reklamuotojas. MetaversePost yra įsipareigojusi teikti tikslias, nešališkas ataskaitas, tačiau rinkos sąlygos gali keistis be įspėjimo.

Apie autorių

Agnė yra žurnalistė, kuri pasakoja apie naujausias tendencijas ir pokyčius metaverse, AI ir Web3 pramonės šakoms Metaverse Post. Jos aistra pasakojimui paskatino ją vesti daugybę interviu su šių sričių ekspertais, visada siekdama atskleisti įdomių ir įtraukiančių istorijų. Agnė yra įgijusi literatūros bakalauro laipsnį ir daug rašo įvairiomis temomis, įskaitant keliones, meną ir kultūrą. Ji taip pat savanoriavo gyvūnų teisių organizacijos redaktore, kur padėjo didinti informuotumą apie gyvūnų gerovės problemas. Susisiekite su ja [apsaugotas el. paštu].

Daugiau straipsnių
Agnė Cimerman
Agnė Cimerman

Agnė yra žurnalistė, kuri pasakoja apie naujausias tendencijas ir pokyčius metaverse, AI ir Web3 pramonės šakoms Metaverse Post. Jos aistra pasakojimui paskatino ją vesti daugybę interviu su šių sričių ekspertais, visada siekdama atskleisti įdomių ir įtraukiančių istorijų. Agnė yra įgijusi literatūros bakalauro laipsnį ir daug rašo įvairiomis temomis, įskaitant keliones, meną ir kultūrą. Ji taip pat savanoriavo gyvūnų teisių organizacijos redaktore, kur padėjo didinti informuotumą apie gyvūnų gerovės problemas. Susisiekite su ja [apsaugotas el. paštu].

Ateina nuosprendžio paskelbimo diena: CZ likimas subalansuotas, nes JAV teismas svarsto DOJ prašymą

Changpeng Zhao šiandien laukia nuosprendžio JAV teisme Sietle.

Žinoti daugiau

Samourai piniginės įkūrėjai apkaltinti palengvinę 2 mlrd. USD „Darknet“ sandorius

„Samourai Wallet“ įkūrėjų nuogąstavimai yra reikšmingas pramonės nuosmukis, pabrėžiantis nuolatinį ...

Žinoti daugiau
Prisijunkite prie mūsų naujoviškų technologijų bendruomenės
Skaityti daugiau
Skaityti daugiau
AI renesansas žaidimų kūrimo srityje 2024 m
AI Wiki Metaverse Wiki Išsilavinimas rinkos programinė įranga Technologija
AI renesansas žaidimų kūrimo srityje 2024 m
Gali 1, 2024
Estée Lauder naujojoje AI inovacijų laboratorijoje: atidžiau pažvelkite į tai, kaip generatyvus AI keičia grožio prekių ženklus
Gyvenimo būdas programinė įranga Istorijos ir apžvalgos Technologija
Estée Lauder naujojoje AI inovacijų laboratorijoje: atidžiau pažvelkite į tai, kaip generatyvus AI keičia grožio prekių ženklus
Gali 1, 2024
„Chainlink“ ir greitas papildymas bendradarbiauja kuriant CCIP pagrįstą „blockchain“ adapterį
Atsakingas verslas Naujienų ataskaita Technologija
„Chainlink“ ir greitas papildymas bendradarbiauja kuriant CCIP pagrįstą „blockchain“ adapterį
Gali 1, 2024
„BitSmiley“ pristato „Alphanet V1“, debiutuoja „Bitcoin Layer 2“ tinklo bitų sluoksnyje
Naujienų ataskaita Technologija
„BitSmiley“ pristato „Alphanet V1“, debiutuoja „Bitcoin Layer 2“ tinklo bitų sluoksnyje
Gali 1, 2024
CRYPTOMERIA LABS PTE. LTD.