Новини Технологии
Март 15, 2023

GPT-4 Може да обработи вашите заявки за изображения, документи, диаграми и екранни снимки

Накратко

GPT-4 може да обработва заявки за изображения, документи, диаграми и екранни снимки. Това е подобрение спрямо GPT-3, който обработваше само текст.

GPT-4 има превъзходно представяне на различни изпити и тестове и има достъп до допълнителна информация и подробности чрез изображения, които може да не са налични в писмен вид.

gpt-4 изображения документи екранни снимки

OpenAIНай-новият крайъгълен камък, новият модел GPT-4, може да приема заявки, които включват изображения, документи с текст, диаграми или екранни снимки като вход. Това представлява значително подобрение спрямо предишната версия, GPT-3, който можеше да разбира и извежда само текст. С тази нова функция, GPT-4 генерира текстови изходи при дадени входове, състоящи се от разпръснат текст и изображения.

„В редица домейни – включително документи с текст и снимки, диаграми или екранни снимки –GPT-4 проявява подобни възможности, както при въвеждане само на текст,“

OpenAI пише.

ChatGPT-4 има по-голям размер от своите предшественици, което показва, че е преминал обучение за по-голямо количество данни и съдържа повече тегла в моделния си файл, което води до по-високи разходи за неговата работа. Най-новият AI език може да генерира текст, подобен на човек, като използва дълбоко учене и предварително обучение върху голям набор от данни.

GPT-4 има демонстрира превъзходна производителност спрямо други езици на ИИ в различни изпити и тестове, което се дължи отчасти на способността му за достъп до допълнителна информация и подробности чрез изображения, които може да не са налични в писмена форма.

Новото GPT-4 моделът може да ви каже какво точно е изобразено на илюстрацията, да го анализира и дори да обясни значението му. В демонстрацията, GPT-4 обясни визуалната шега, където VGA кабел е свързан към iPhone. Това може също да обясни какво е необичайно в картина, представяща „екстремно гладене“, която можете да разгледате по-долу.

gpt-4 изображения
Източник: OpenAI

Има обаче и по-полезни последици за GPT-4новооткритите знания на. В презентацията беше показано, че PGT-4 може да каже какво може да се сготви от съставките, показани на снимката. Това означава, че моделът може да ви помогне да готвите, ако имате хранителни продукти и нямате представа какво да правите с тях. Направете моментна снимка на храната, която имате, и чат-GPT може да ви каже какво можете да приготвите от съставките, които имате у дома.

Тази способност за разбиране и тълкуване на визуална информация прави GPT-4 мощен инструмент за задачи като надписи на изображения, визуални отговори на въпроси и дори създаване на съдържание. С интегрирането както на текст, така и на визуално разбиране, GPT-4 има потенциала да революционизира различни индустрии, като реклама, дизайн и електронна търговия, и да помогне на хората да вършат скучните, светски задачи вместо тях.

Разширеният езиков модел също така „разбира“ екранни снимки и документи с текст, таблици, диаграми или други визуални представяния. Например, ако качите научна статия от три страници и имате нужда от нея обобщена и обяснена, GPT-4 е в състояние да го направи. 

Водещият на Bloomberg Джон Ерлихман демонстрира как е успял да трансформира ръчно скициран дизайн във функционален уебсайт.

Новата технология може да се използва и като помощно средство за придвижване, тъй като може да се използва за описание на средата за хора с увредено зрение. За тази цел Open AI вече си партнира с приложение, наречено Бъди ми очи който е създаден, за да помогне на незрящи хора, когато трябва да разгледат нещо, например докато пазаруват. Приложението позволява на „зрящи доброволци и професионалисти да дават очите си за решаване на големи и малки задачи, за да помогнат на слепи хора и хора със слабо зрение да водят по-независим живот“. Сега той предлага и виртуален инструмент за доброволци, захранван от OpenAIЕ GPT-4.

Въпреки че OpenAIЕ GPT-4 в момента предлага възможност за обработка на текст и изображения като входове, моделът все още не е оборудван да обработва аудио и видео входове. Въпреки това има индикации, че тези модалности могат да бъдат включени в следващата итерация на технологията.

Чети повече:

Отказ от отговорност

В съответствие с Доверете се насоките на проекта, моля, имайте предвид, че предоставената на тази страница информация не е предназначена да бъде и не трябва да се тълкува като правен, данъчен, инвестиционен, финансов или каквато и да е друга форма на съвет. Важно е да инвестирате само това, което можете да си позволите да загубите, и да потърсите независим финансов съвет, ако имате някакви съмнения. За допълнителна информация предлагаме да се обърнете към правилата и условията, както и към страниците за помощ и поддръжка, предоставени от издателя или рекламодателя. MetaversePost се ангажира с точно, безпристрастно отчитане, но пазарните условия подлежат на промяна без предизвестие.

За автора

Агне е журналист, който отразява най-новите тенденции и развития в метавселената, ИИ и Web3 индустрии за Metaverse Post. Нейната страст към разказването на истории я кара да провежда множество интервюта с експерти в тези области, като винаги се стреми да разкрива вълнуващи и ангажиращи истории. Агне има бакалавърска степен по литература и има богат опит в писането на широк спектър от теми, включително пътуване, изкуство и култура. Тя също е била доброволец като редактор на организацията за правата на животните, където е помогнала за повишаване на осведомеността относно проблемите, свързани с хуманното отношение към животните. Свържете се с нея на [имейл защитен].

Още статии
Агне Цимерман
Агне Цимерман

Агне е журналист, който отразява най-новите тенденции и развития в метавселената, ИИ и Web3 индустрии за Metaverse Post. Нейната страст към разказването на истории я кара да провежда множество интервюта с експерти в тези области, като винаги се стреми да разкрива вълнуващи и ангажиращи истории. Агне има бакалавърска степен по литература и има богат опит в писането на широк спектър от теми, включително пътуване, изкуство и култура. Тя също е била доброволец като редактор на организацията за правата на животните, където е помогнала за повишаване на осведомеността относно проблемите, свързани с хуманното отношение към животните. Свържете се с нея на [имейл защитен].

Hot Stories
Присъединете се към нашия бюлетин.
Последни новини

Пристига денят на присъдата: Съдбата на CZ виси на равновесие, докато американският съд разглежда молбата на DOJ

Changpeng Zhao е готов да бъде осъден днес в американски съд в Сиатъл.

Научете още

Основателите на портфейла Samourai са обвинени в улесняване на $2 милиарда в Darknet сделки

Заплахата от страна на основателите на портфейла Samourai Wallet представлява забележителна неуспех за индустрията, подчертавайки постоянните...

Научете още
Присъединете се към нашата иновативна техническа общност
Вижте повече
Прочети повече
Ankr си сътрудничи с AI Blockchain платформа Talus Network, за да отключи биткойн ликвидност за AI
Бизнес Новини Технологии
Ankr си сътрудничи с AI Blockchain платформа Talus Network, за да отключи биткойн ликвидност за AI
Май 1, 2024
Binance Labs поддържа Movement Labs, за да улесни интеграцията на Facebook Move в блокчейни
Бизнес Новини Технологии
Binance Labs поддържа Movement Labs, за да улесни интеграцията на Facebook Move в блокчейни
Май 1, 2024
BRICS Nations Eye Решение за търговия със стейбълкойни
Бизнес пазари Истории и рецензии Технологии
BRICS Nations Eye Решение за търговия със стейбълкойни
Май 1, 2024
Bitcoin L2 мрежа BOB се интегрира с LayerZero за подобрена функционалност
Бизнес Новини Технологии
Bitcoin L2 мрежа BOB се интегрира с LayerZero за подобрена функционалност
Май 1, 2024
CRYPTOMERIA LABS PTE. LTD.