Novinová správa Technológia
March 15, 2023

GPT-4 Dokáže spracovať vaše požiadavky na obrázky, dokumenty, diagramy a snímky obrazovky

Stručne

GPT-4 dokáže spracovať požiadavky na obrázky, dokumenty, diagramy a snímky obrazovky. Je to zlepšenie oproti GPT-3, ktorý spracovával iba text.

GPT-4 má vynikajúci výkon v rôznych skúškach a testoch a má prístup k ďalším informáciám a podrobnostiam prostredníctvom obrázkov, ktoré nemusia byť dostupné v písomnej forme.

gpt-4 obrázky dokumentov snímky obrazovky

OpenAInajnovší míľnik spoločnosti, nový model GPT-4, môže prijímať požiadavky, ktoré zahŕňajú obrázky, dokumenty s textom, diagramy alebo snímky obrazovky ako vstupy. To predstavuje výrazné zlepšenie oproti predchádzajúcej verzii, GPT-3, ktorý mohol len porozumieť a vydávať text. Vďaka tejto novej funkcii GPT-4 generuje textové výstupy dané vstupy pozostávajúce z rozptýleného textu a obrázkov.

„V celom rade domén – vrátane dokumentov s textom a fotografiami, diagramami alebo snímkami obrazovky –GPT-4 vykazuje podobné schopnosti ako pri textových vstupoch,“

OpenAI napísal.

ChatGPT-4 má väčšiu veľkosť ako jeho predchodcovia, čo naznačuje, že prešiel tréningom na väčšom množstve údajov a obsahuje viac váh vo svojom modelovom súbore, čo má za následok vyššie náklady na jeho prevádzku. Najnovší jazyk AI dokáže pomocou generovať ľudský text hlboké vzdelávanie a byť vopred vyškolený na veľký súbor údajov.

GPT-4 má preukázal vynikajúci výkon v porovnaní s inými jazykmi AI v rôznych skúškach a testoch čiastočne vďaka svojej schopnosti získať ďalšie informácie a podrobnosti prostredníctvom obrázkov, ktoré nemusia byť dostupné v písomnej forme.

Nový GPT-4 model vám môže povedať, čo presne je zobrazené na obrázku, analyzovať to a dokonca vysvetliť jeho význam. V ukážke GPT-4 vysvetlil vizuálny vtip, kde je k iPhonu pripojený VGA kábel. Mohlo by to tiež vysvetliť, čo je nezvyčajné na obrázku predstavujúcom „extrémne žehlenie“, ktorý si môžete pozrieť nižšie.

gpt-4 obrazy
zdroj: OpenAI

Existujú však aj užitočnejšie dôsledky GPT-4novoobjavené poznatky. V prezentácii sa ukázalo, že PGT-4 vie povedať, čo sa dá uvariť zo surovín zobrazených na obrázku. To znamená, že model vám môže pomôcť pri varení, ak máte potravinové produkty a neviete, čo s nimi robiť. Urobte si snímku jedla, ktoré máte, a chatujteGPT vám povie, čo všetko si môžete pripraviť zo surovín, ktoré máte doma.

Táto schopnosť porozumieť a interpretovať vizuálne informácie robí GPT-4 výkonný nástroj pre úlohy, ako je popisovanie obrázkov, vizuálne zodpovedanie otázok a dokonca aj vytváranie obsahu. Vďaka integrácii textu a vizuálneho porozumenia GPT-4 má potenciál spôsobiť revolúciu v rôznych odvetviach, ako je reklama, dizajn a elektronický obchod, a pomôcť ľuďom robiť za nich nudné, všedné úlohy.

Pokročilé jazykový model tiež „rozumie“ snímkam obrazovky a dokumentom s textom, tabuľkami, diagramami alebo inými vizuálnymi reprezentáciami. Ak napríklad nahráte trojstranový výskumný dokument a potrebujete ho zhrnúť a vysvetliť, GPT-4 je toho schopný. 

Moderátor Bloombergu Jon Erlichman predviedol, ako dokázal premeniť ručne načrtnutý dizajn na funkčný web.

Nová technológia môže slúžiť aj ako pomôcka pri pohybe, keďže by sa dala použiť na opis prostredia pre ľudí so zrakovým postihnutím. Za týmto účelom už Open AI spolupracuje s aplikáciou tzv Buď mojimi očami ktorý bol navrhnutý tak, aby nevidomým ľuďom podal pomocnú ruku, keď sa potrebujú na niečo pozrieť, napríklad pri nákupe potravín. Aplikácia umožňuje „vidiacim dobrovoľníkom a profesionálom prepožičať oči, aby riešili veľké i malé úlohy, aby pomohli nevidiacim a slabozrakým ľuďom viesť nezávislejší život“. Teraz ponúka aj virtuálny dobrovoľnícky nástroj OpenAI'S GPT-4.

Hoci OpenAI'S GPT-4 v súčasnosti ponúka možnosť spracovania textu a obrázkov ako vstupov, model zatiaľ nie je vybavený na spracovanie audio a video vstupov. Napriek tomu existujú náznaky, že tieto modality by mohli byť zahrnuté v ďalšej iterácii technológie.

Prečítajte si viac:

Vylúčenie zodpovednosti

V súlade s Pokyny k projektu Trust, uvedomte si, že informácie uvedené na tejto stránke nie sú zamýšľané a nemali by byť interpretované ako právne, daňové, investičné, finančné alebo iné formy poradenstva. Je dôležité investovať len toľko, koľko si môžete dovoliť stratiť a v prípade akýchkoľvek pochybností vyhľadať nezávislé finančné poradenstvo. Ak chcete získať ďalšie informácie, odporúčame vám pozrieť si zmluvné podmienky, ako aj stránky pomoci a podpory poskytnuté vydavateľom alebo inzerentom. MetaversePost sa zaviazala poskytovať presné a nezaujaté správy, ale podmienky na trhu sa môžu zmeniť bez upozornenia.

O autorovi

Agne je novinárka, ktorá pokrýva najnovšie trendy a vývoj v oblasti metaverse, AI a Web3 priemyslu pre Metaverse Post. Jej vášeň pre rozprávanie ju priviedla k mnohým rozhovorom s odborníkmi v týchto oblastiach, pričom sa vždy snažila odhaliť vzrušujúce a pútavé príbehy. Agne má bakalársky titul v odbore literatúra a má rozsiahle skúsenosti s písaním o širokej škále tém vrátane cestovania, umenia a kultúry. Dobrovoľne pracovala aj ako redaktorka organizácie za práva zvierat, kde pomáhala zvyšovať povedomie o otázkach dobrých životných podmienok zvierat. Kontaktujte ju [chránené e-mailom].

Ďalšie články
Agne Cimermanová
Agne Cimermanová

Agne je novinárka, ktorá pokrýva najnovšie trendy a vývoj v oblasti metaverse, AI a Web3 priemyslu pre Metaverse Post. Jej vášeň pre rozprávanie ju priviedla k mnohým rozhovorom s odborníkmi v týchto oblastiach, pričom sa vždy snažila odhaliť vzrušujúce a pútavé príbehy. Agne má bakalársky titul v odbore literatúra a má rozsiahle skúsenosti s písaním o širokej škále tém vrátane cestovania, umenia a kultúry. Dobrovoľne pracovala aj ako redaktorka organizácie za práva zvierat, kde pomáhala zvyšovať povedomie o otázkach dobrých životných podmienok zvierat. Kontaktujte ju [chránené e-mailom].

Hot Stories

BRICS Nations Eye Stablecoin obchodné riešenie

by Viktória Palčiková
Môže 01, 2024
Pridajte sa k nášmu newsletteru.
Novinky

Prichádza deň odsúdenia: Osud CZ visí v rovnováhe, pretože americký súd zvažuje žalobu ministerstva spravodlivosti

Changpeng Zhao dnes čaká na americkom súde v Seattli odsúdenie.

vedieť viac

Zakladatelia Peňaženky Samourai boli obvinení z uľahčenia obchodov Darknet v hodnote 2 miliárd USD

Obavy zakladateľov Peňaženky Samourai predstavujú pre odvetvie pozoruhodnú prekážku, ktorá podčiarkuje pretrvávajúcu ...

vedieť viac
Pripojte sa k našej komunite inovatívnych technológií
Čítaj viac
Čítaj viac
Ankr spolupracuje s platformou AI Blockchain Talus Network na odblokovaní bitcoinovej likvidity pre AI
firmy Novinová správa Technológia
Ankr spolupracuje s platformou AI Blockchain Talus Network na odblokovaní bitcoinovej likvidity pre AI
Môže 1, 2024
Binance Labs podporuje pohybové laboratóriá na uľahčenie integrácie Facebooku naprieč blockchainmi
firmy Novinová správa Technológia
Binance Labs podporuje pohybové laboratóriá na uľahčenie integrácie Facebooku naprieč blockchainmi
Môže 1, 2024
BRICS Nations Eye Stablecoin obchodné riešenie
firmy trhy Príbehy a recenzie Technológia
BRICS Nations Eye Stablecoin obchodné riešenie
Môže 1, 2024
Bitcoin L2 Network BOB sa integruje s LayerZero pre vylepšenú funkčnosť
firmy Novinová správa Technológia
Bitcoin L2 Network BOB sa integruje s LayerZero pre vylepšenú funkčnosť
Môže 1, 2024
CRYPTOMERIA LABS PTE. LTD.