Novinky Technika
15. března 2023

GPT-4 Dokáže zpracovat vaše požadavky na obrázky, dokumenty, diagramy a snímky obrazovky

Stručně

GPT-4 dokáže zpracovat požadavky na obrázky, dokumenty, diagramy a snímky obrazovky. Je to zlepšení oproti GPT-3, který zpracovával pouze text.

GPT-4 má vynikající výkon v různých zkouškách a testech a má přístup k dalším informacím a podrobnostem prostřednictvím obrázků, které nemusí být k dispozici v písemné podobě.

gpt-4 obrázky dokumentů snímky obrazovky

OpenAInejnovější milník společnosti, nový model GPT-4, může přijímat požadavky, které zahrnují obrázky, dokumenty s textem, diagramy nebo snímky obrazovky jako vstupy. To představuje výrazné zlepšení oproti předchozí verzi, GPT-3, který mohl pouze rozumět a vydávat text. S touto novou funkcí GPT-4 generuje textové výstupy dané vstupy sestávající z proloženého textu a obrázků.

„V řadě domén – včetně dokumentů s textem a fotografiemi, diagramy nebo snímky obrazovky –GPT-4 vykazuje podobné schopnosti jako u textových vstupů,“

OpenAI napsal.

ChatGPT-4 má větší velikost než jeho předchůdci, což naznačuje, že prošel školením na větším množství dat a obsahuje více vah ve svém modelovém souboru, což má za následek vyšší náklady na jeho provoz. Nejnovější jazyk AI dokáže pomocí generovat lidský text hluboké učení a být předem vyškoleni na velké datové sadě.

GPT-4 má prokázal vynikající výkon oproti jiným jazykům AI v různých zkouškách a testech částečně díky své schopnosti získat přístup k dalším informacím a podrobnostem prostřednictvím obrázků, které nemusí být dostupné v písemné podobě.

Nový GPT-4 model vám může říct, co přesně je na obrázku znázorněno, analyzovat to a dokonce vysvětlit jeho význam. v ukázce GPT-4 vysvětlil vizuální vtip, kdy je k iPhonu připojen VGA kabel. Mohlo by to také vysvětlit, co je neobvyklého na obrázku představujícím „extrémní žehlení“, který si můžete prohlédnout níže.

gpt-4 obrazy
Zdroj: OpenAI

Existují však také užitečnější důsledky GPT-4nově nabyté znalosti. V prezentaci bylo ukázáno, že PGT-4 dokáže říct, co by se dalo uvařit z ingrediencí zobrazených na obrázku. To znamená, že vám model může pomoci vařit, pokud máte potravinářské produkty a nevíte, co s nimi dělat. Udělejte snímek jídla, které máte, a chatujte-GPT vám může prozradit, co si můžete připravit ze surovin, které máte doma.

Tato schopnost porozumět a interpretovat vizuální informace vytváří GPT-4 výkonný nástroj pro úkoly, jako je popisování obrázků, vizuální zodpovězení otázek a dokonce i tvorba obsahu. Díky integraci textu a vizuálního porozumění GPT-4 má potenciál způsobit revoluci v různých odvětvích, jako je reklama, design a elektronický obchod, a pomoci lidem dělat za ně nudné, všední úkoly.

Pokročilé jazykový model také „rozumí“ snímkům obrazovky a dokumentům s textem, tabulkami, diagramy nebo jinými vizuálními reprezentacemi. Pokud například nahrajete třístránkový výzkumný dokument a potřebujete jej shrnout a vysvětlit, GPT-4 je toho schopen. 

Moderátor Bloombergu Jon Erlichman předvedl, jak dokázal přeměnit ručně načrtnutý design na funkční web.

Nová technologie může být také použita jako pomůcka pro mobilitu, protože by mohla být použita k popisu prostředí pro lidi se zrakovým postižením. Za tímto účelem již Open AI navázala partnerství s aplikací s názvem Buď mýma očima který byl navržen tak, aby nevidomým lidem podal pomocnou ruku, když se potřebují na něco podívat, například při nákupu potravin. Aplikace umožňuje „vidomým dobrovolníkům a profesionálům půjčit své oči k řešení velkých i malých úkolů, aby pomohli nevidomým a slabozrakým lidem vést nezávislejší život“. Nyní nabízí také virtuální dobrovolnický nástroj poháněný OpenAIJe GPT-4.

Ačkoli OpenAIJe GPT-4 aktuálně nabízí možnost zpracovávat text a obrázky jako vstupy, model zatím není vybaven pro zpracování audio a video vstupů. Nicméně existují náznaky, že by tyto modality mohly být zahrnuty do příští iterace technologie.

Čtěte více:

Odmítnutí odpovědnosti

V souladu s Pokyny k projektu Trust, prosím vezměte na vědomí, že informace uvedené na této stránce nejsou určeny a neměly by být vykládány jako právní, daňové, investiční, finanční nebo jakékoli jiné formy poradenství. Je důležité investovat jen to, co si můžete dovolit ztratit, a v případě pochybností vyhledat nezávislé finanční poradenství. Pro další informace doporučujeme nahlédnout do smluvních podmínek a také na stránky nápovědy a podpory poskytnuté vydavatelem nebo inzerentem. MetaversePost se zavázala poskytovat přesné a nezaujaté zprávy, ale podmínky na trhu se mohou bez upozornění změnit.

O autorovi

Agne je novinářka, která se zabývá nejnovějšími trendy a vývojem v metaverse, AI a Web3 průmysl pro Metaverse Post. Její vášeň pro vyprávění ji přivedla k četným rozhovorům s odborníky v těchto oblastech, ve kterých se vždy snažila odhalit vzrušující a poutavé příběhy. Agne má bakalářský titul z literatury a má rozsáhlé zkušenosti s psaním o široké škále témat, včetně cestování, umění a kultury. Přihlásila se také jako redaktorka do organizace pro práva zvířat, kde pomáhala zvyšovat povědomí o otázkách dobrých životních podmínek zvířat. Kontaktujte ji [chráněno e-mailem].

Další články
Agne Cimermanová
Agne Cimermanová

Agne je novinářka, která se zabývá nejnovějšími trendy a vývojem v metaverse, AI a Web3 průmysl pro Metaverse Post. Její vášeň pro vyprávění ji přivedla k četným rozhovorům s odborníky v těchto oblastech, ve kterých se vždy snažila odhalit vzrušující a poutavé příběhy. Agne má bakalářský titul z literatury a má rozsáhlé zkušenosti s psaním o široké škále témat, včetně cestování, umění a kultury. Přihlásila se také jako redaktorka do organizace pro práva zvířat, kde pomáhala zvyšovat povědomí o otázkách dobrých životních podmínek zvířat. Kontaktujte ji [chráněno e-mailem].

Přichází den odsouzení: Osud CZ visí v rovnováze, protože americký soud zvažuje žalobu ministerstva spravedlnosti

Changpeng Zhao je dnes připraven čelit rozsudku u amerického soudu v Seattlu.

Vědět více

Zakladatelé peněženky Samourai byli obviněni z usnadňování 2 miliard dolarů v obchodech Darknet

Obavy zakladatelů Peněženky Samourai představují pro průmysl významnou překážku, která podtrhuje přetrvávající ...

Vědět více
Připojte se k naší komunitě inovativních technologií
Více
Dozvědět se více
Ankr spolupracuje s platformou AI Blockchain Talus Network na odblokování bitcoinové likvidity pro AI
Business Novinky Technika
Ankr spolupracuje s platformou AI Blockchain Talus Network na odblokování bitcoinové likvidity pro AI
1
Binance Labs podporuje Movement Labs, aby usnadnila integraci pohybu Facebooku napříč blockchainy
Business Novinky Technika
Binance Labs podporuje Movement Labs, aby usnadnila integraci pohybu Facebooku napříč blockchainy
1
BRICS Nations Eye Stablecoin obchodní řešení
Business Trhy Příběhy a recenze Technika
BRICS Nations Eye Stablecoin obchodní řešení
1
Bitcoin L2 Network BOB se integruje s LayerZero pro vylepšenou funkčnost
Business Novinky Technika
Bitcoin L2 Network BOB se integruje s LayerZero pro vylepšenou funkčnost
1
CRYPTOMERIA LABS PTE. LTD.