Новостной репортаж Технологии
15 марта 2023

GPT-4 Может обрабатывать ваши запросы на изображения, документы, диаграммы и снимки экрана

Коротко

GPT-4 может обрабатывать запросы изображений, документов, диаграмм и снимков экрана. Это улучшение по сравнению с GPT-3, который обрабатывал только текст.

GPT-4 имеет превосходные результаты на различных экзаменах и тестах и ​​может получить доступ к дополнительной информации и деталям через изображения, которые могут быть недоступны в письменной форме.

gpt-4 картинки документы скриншоты

OpenAIпоследняя веха, новая модель GPT-4, может принимать запросы, включающие в качестве входных данных изображения, документы с текстом, диаграммы или снимки экрана. Это представляет собой значительное улучшение по сравнению с предыдущей версией, GPT-3, который мог только понимать и выводить текст. Благодаря этой новой функции GPT-4 генерирует текстовые выходные данные с учетом входных данных, состоящих из вкраплений текста и изображений.

«В различных областях, включая документы с текстом и фотографиями, диаграммами или скриншотами,GPT-4 демонстрирует те же возможности, что и при вводе только текста».

OpenAI написал.

ChatGPT-4 имеет больший размер, чем его предшественники, что указывает на то, что он прошел обучение на большем объеме данных и содержит больше весов в файле модели, что приводит к более высоким затратам на его работу. Новейший язык искусственного интеллекта может генерировать текст, похожий на человеческий, используя глубокое обучение и проходят предварительную подготовку на большом наборе данных.

GPT-4 и продемонстрировал превосходную производительность по сравнению с другими языками ИИ в различных экзаменах и тестах отчасти из-за его способности получать доступ к дополнительной информации и деталям через изображения, которые могут быть недоступны в письменной форме.

Новый GPT-4 Модель может рассказать, что именно изображено на иллюстрации, проанализировать ее и даже объяснить ее смысл. В демо-версии GPT-4 объяснил визуальный анекдот о подключении кабеля VGA к iPhone. Это также могло бы объяснить, что необычного на картинке, изображающей «экстремальное глажение», которую вы можете увидеть ниже.

gpt-4 изображений
Источник: OpenAI

Однако есть и более полезные последствия. GPT-4новые знания. В презентации было показано, что ПГТ-4 может подсказать, что можно приготовить из ингредиентов, показанных на картинке. Это значит, что модель поможет вам готовить, если у вас есть продукты и вы не знаете, что с ними делать. Сделайте снимок еды, которая у вас есть, и пообщайтесь в чате.GPT Могу рассказать, что можно приготовить из ингредиентов, которые есть у вас дома.

Эта способность понимать и интерпретировать визуальную информацию делает GPT-4 мощный инструмент для таких задач, как создание подписей к изображениям, визуальные ответы на вопросы и даже создание контента. Благодаря интеграции текста и визуального понимания, GPT-4 имеет потенциал совершить революцию в различных отраслях, таких как реклама, дизайн и электронная коммерция, и помочь людям выполнять за них скучные, обыденные задачи.

Передовая языковая модель также «понимает» снимки экрана и документы с текстом, таблицами, диаграммами или другими визуальными представлениями. Например, если вы загружаете трехстраничную исследовательскую работу и нуждаетесь в ее обобщении и объяснении, GPT-4 способен это сделать. 

Ведущий Bloomberg Джон Эрлихман продемонстрировал, как ему удалось превратить набросок от руки в функциональный веб-сайт.

Новую технологию также можно использовать в качестве средства передвижения, поскольку ее можно использовать для описания окружающей среды для людей с нарушениями зрения. С этой целью Open AI уже сотрудничает с приложением под названием Будьте My Eyes который был разработан, чтобы протянуть руку помощи слепым людям, когда им нужно взглянуть на что-то, например, при покупке продуктов. Приложение позволяет «зрячим волонтерам и профессионалам решать большие и маленькие задачи, помогая слепым и слабовидящим людям вести более независимую жизнь». Теперь он также предлагает виртуальный волонтерский инструмент на базе OpenAIАвтора GPT-4.

Несмотря на то, что OpenAIАвтора GPT-4 в настоящее время предлагает возможность обработки текста и изображений в качестве входных данных, модель еще не оборудована для обработки аудио- и видеовходов. Тем не менее, есть признаки того, что эти методы могут быть включены в следующую версию технологии.

Прочитайте больше:

Отказ от ответственности

В соответствии с Руководство трастового проектаОбратите внимание, что информация, представленная на этой странице, не предназначена и не должна интерпретироваться как юридическая, налоговая, инвестиционная, финансовая или любая другая форма консультации. Важно инвестировать только то, что вы можете позволить себе потерять, и обращаться за независимой финансовой консультацией, если у вас есть какие-либо сомнения. Для получения дополнительной информации мы предлагаем обратиться к положениям и условиям, а также к страницам справки и поддержки, предоставленным эмитентом или рекламодателем. MetaversePost стремится предоставлять точную и объективную отчетность, однако рыночные условия могут быть изменены без предварительного уведомления.

Об авторе

Агне — журналист, освещающий последние тенденции и разработки в области метавселенной, искусственного интеллекта и Web3 отрасли для Metaverse Post. Ее страсть к рассказыванию историй побудила ее проводить многочисленные интервью с экспертами в этих областях, всегда стремясь раскрыть захватывающие и увлекательные истории. Агне имеет степень бакалавра литературы и имеет обширный опыт написания статей на самые разные темы, включая путешествия, искусство и культуру. Она также работала волонтером в качестве редактора организации по защите прав животных, где помогала повышать осведомленность о проблемах защиты животных. Свяжитесь с ней по [электронная почта защищена].

Другие статьи
Агне Цимерман
Агне Цимерман

Агне — журналист, освещающий последние тенденции и разработки в области метавселенной, искусственного интеллекта и Web3 отрасли для Metaverse Post. Ее страсть к рассказыванию историй побудила ее проводить многочисленные интервью с экспертами в этих областях, всегда стремясь раскрыть захватывающие и увлекательные истории. Агне имеет степень бакалавра литературы и имеет обширный опыт написания статей на самые разные темы, включая путешествия, искусство и культуру. Она также работала волонтером в качестве редактора организации по защите прав животных, где помогала повышать осведомленность о проблемах защиты животных. Свяжитесь с ней по [электронная почта защищена].

Hot Stories
Подпишитесь на нашу рассылку.
Новости

Наступил день вынесения приговора: судьба CZ висит на волоске, поскольку суд США рассматривает ходатайство Министерства юстиции

Чанпэн Чжао сегодня предстанет перед судом США в Сиэтле.

Узнать больше

Основателей Samourai Wallet обвиняют в содействии сделкам в даркнете на 2 миллиарда долларов

Задержание основателей Samourai Wallet представляет собой заметную неудачу для отрасли, подчеркивая упорное...

Узнать больше
Присоединяйтесь к нашему сообществу инновационных технологий
Узнать больше
Читать далее
Ankr сотрудничает с блокчейн-платформой искусственного интеллекта Talus Network, чтобы разблокировать ликвидность биткойнов для искусственного интеллекта
Бизнес Новостной репортаж Технологии
Ankr сотрудничает с блокчейн-платформой искусственного интеллекта Talus Network, чтобы разблокировать ликвидность биткойнов для искусственного интеллекта
1 мая 2024
Binance Labs поддерживает лаборатории Movement, чтобы облегчить интеграцию Facebook Move в блокчейны
Бизнес Новостной репортаж Технологии
Binance Labs поддерживает лаборатории Movement, чтобы облегчить интеграцию Facebook Move в блокчейны
1 мая 2024
Страны БРИКС рассматривают торговое решение для стейблкоинов
Бизнес Области применения: Истории и обзоры Технологии
Страны БРИКС рассматривают торговое решение для стейблкоинов
1 мая 2024
Сеть Bitcoin L2 BOB интегрируется с LayerZero для расширения функциональности
Бизнес Новостной репортаж Технологии
Сеть Bitcoin L2 BOB интегрируется с LayerZero для расширения функциональности
1 мая 2024
CRYPTOMERIA LABS PTE. ООО