GPT-4 Dokáže spracovať vaše požiadavky na obrázky, dokumenty, diagramy a snímky obrazovky
Stručne
GPT-4 dokáže spracovať požiadavky na obrázky, dokumenty, diagramy a snímky obrazovky. Je to zlepšenie oproti GPT-3, ktorý spracovával iba text.
GPT-4 má vynikajúci výkon v rôznych skúškach a testoch a má prístup k ďalším informáciám a podrobnostiam prostredníctvom obrázkov, ktoré nemusia byť dostupné v písomnej forme.
OpenAInajnovší míľnik spoločnosti, nový model GPT-4, môže prijímať požiadavky, ktoré zahŕňajú obrázky, dokumenty s textom, diagramy alebo snímky obrazovky ako vstupy. To predstavuje výrazné zlepšenie oproti predchádzajúcej verzii, GPT-3, ktorý mohol len porozumieť a vydávať text. Vďaka tejto novej funkcii GPT-4 generuje textové výstupy dané vstupy pozostávajúce z rozptýleného textu a obrázkov.
„V celom rade domén – vrátane dokumentov s textom a fotografiami, diagramami alebo snímkami obrazovky –GPT-4 vykazuje podobné schopnosti ako pri textových vstupoch,“
OpenAI napísal.
ChatGPT-4 má väčšiu veľkosť ako jeho predchodcovia, čo naznačuje, že prešiel tréningom na väčšom množstve údajov a obsahuje viac váh vo svojom modelovom súbore, čo má za následok vyššie náklady na jeho prevádzku. Najnovší jazyk AI dokáže pomocou generovať ľudský text hlboké vzdelávanie a byť vopred vyškolený na veľký súbor údajov.
GPT-4 má preukázal vynikajúci výkon v porovnaní s inými jazykmi AI v rôznych skúškach a testoch čiastočne vďaka svojej schopnosti získať ďalšie informácie a podrobnosti prostredníctvom obrázkov, ktoré nemusia byť dostupné v písomnej forme.
Nový GPT-4 model vám môže povedať, čo presne je zobrazené na obrázku, analyzovať to a dokonca vysvetliť jeho význam. V ukážke GPT-4 vysvetlil vizuálny vtip, kde je k iPhonu pripojený VGA kábel. Mohlo by to tiež vysvetliť, čo je nezvyčajné na obrázku predstavujúcom „extrémne žehlenie“, ktorý si môžete pozrieť nižšie.
Existujú však aj užitočnejšie dôsledky GPT-4novoobjavené poznatky. V prezentácii sa ukázalo, že PGT-4 vie povedať, čo sa dá uvariť zo surovín zobrazených na obrázku. To znamená, že model vám môže pomôcť pri varení, ak máte potravinové produkty a neviete, čo s nimi robiť. Urobte si snímku jedla, ktoré máte, a chatujteGPT vám povie, čo všetko si môžete pripraviť zo surovín, ktoré máte doma.
Táto schopnosť porozumieť a interpretovať vizuálne informácie robí GPT-4 výkonný nástroj pre úlohy, ako je popisovanie obrázkov, vizuálne zodpovedanie otázok a dokonca aj vytváranie obsahu. Vďaka integrácii textu a vizuálneho porozumenia GPT-4 má potenciál spôsobiť revolúciu v rôznych odvetviach, ako je reklama, dizajn a elektronický obchod, a pomôcť ľuďom robiť za nich nudné, všedné úlohy.
Pokročilé jazykový model tiež „rozumie“ snímkam obrazovky a dokumentom s textom, tabuľkami, diagramami alebo inými vizuálnymi reprezentáciami. Ak napríklad nahráte trojstranový výskumný dokument a potrebujete ho zhrnúť a vysvetliť, GPT-4 je toho schopný.
Moderátor Bloombergu Jon Erlichman predviedol, ako dokázal premeniť ručne načrtnutý dizajn na funkčný web.
Nová technológia môže slúžiť aj ako pomôcka pri pohybe, keďže by sa dala použiť na opis prostredia pre ľudí so zrakovým postihnutím. Za týmto účelom už Open AI spolupracuje s aplikáciou tzv Buď mojimi očami ktorý bol navrhnutý tak, aby nevidomým ľuďom podal pomocnú ruku, keď sa potrebujú na niečo pozrieť, napríklad pri nákupe potravín. Aplikácia umožňuje „vidiacim dobrovoľníkom a profesionálom prepožičať oči, aby riešili veľké i malé úlohy, aby pomohli nevidiacim a slabozrakým ľuďom viesť nezávislejší život“. Teraz ponúka aj virtuálny dobrovoľnícky nástroj OpenAI'S GPT-4.
Hoci OpenAI'S GPT-4 v súčasnosti ponúka možnosť spracovania textu a obrázkov ako vstupov, model zatiaľ nie je vybavený na spracovanie audio a video vstupov. Napriek tomu existujú náznaky, že tieto modality by mohli byť zahrnuté v ďalšej iterácii technológie.
Prečítajte si viac:
- Top 7 spoločností, ktoré prijali GPT-4
- GPT-4-Na základe ChatGPT prekonáva GPT-3 faktorom 570
- Microsoft potvrdzuje, že Bing beží na Advanced GPT-4 Modelka
- GPT-4 vs. GPT-3: Čo ponúka nový model?
Vylúčenie zodpovednosti
V súlade s Pokyny k projektu Trust, uvedomte si, že informácie uvedené na tejto stránke nie sú zamýšľané a nemali by byť interpretované ako právne, daňové, investičné, finančné alebo iné formy poradenstva. Je dôležité investovať len toľko, koľko si môžete dovoliť stratiť a v prípade akýchkoľvek pochybností vyhľadať nezávislé finančné poradenstvo. Ak chcete získať ďalšie informácie, odporúčame vám pozrieť si zmluvné podmienky, ako aj stránky pomoci a podpory poskytnuté vydavateľom alebo inzerentom. MetaversePost sa zaviazala poskytovať presné a nezaujaté správy, ale podmienky na trhu sa môžu zmeniť bez upozornenia.
O autorovi
Agne je novinárka, ktorá pokrýva najnovšie trendy a vývoj v oblasti metaverse, AI a Web3 priemyslu pre Metaverse Post. Jej vášeň pre rozprávanie ju priviedla k mnohým rozhovorom s odborníkmi v týchto oblastiach, pričom sa vždy snažila odhaliť vzrušujúce a pútavé príbehy. Agne má bakalársky titul v odbore literatúra a má rozsiahle skúsenosti s písaním o širokej škále tém vrátane cestovania, umenia a kultúry. Dobrovoľne pracovala aj ako redaktorka organizácie za práva zvierat, kde pomáhala zvyšovať povedomie o otázkach dobrých životných podmienok zvierat. Kontaktujte ju [chránené e-mailom].
Ďalšie článkyAgne je novinárka, ktorá pokrýva najnovšie trendy a vývoj v oblasti metaverse, AI a Web3 priemyslu pre Metaverse Post. Jej vášeň pre rozprávanie ju priviedla k mnohým rozhovorom s odborníkmi v týchto oblastiach, pričom sa vždy snažila odhaliť vzrušujúce a pútavé príbehy. Agne má bakalársky titul v odbore literatúra a má rozsiahle skúsenosti s písaním o širokej škále tém vrátane cestovania, umenia a kultúry. Dobrovoľne pracovala aj ako redaktorka organizácie za práva zvierat, kde pomáhala zvyšovať povedomie o otázkach dobrých životných podmienok zvierat. Kontaktujte ju [chránené e-mailom].