Звіт про новини Технологія
Березня 15, 2023

GPT-4 Може обробити ваші запити на зображення, документи, діаграми та знімки екрана

Коротко

GPT-4 може обробляти запити на зображення, документи, діаграми та знімки екрана. Це покращення GPT-3, який обробляв лише текст.

GPT-4 має чудові результати в різних іспитах і тестах і може отримати доступ до додаткової інформації та деталей через зображення, які можуть бути недоступні в письмовій формі.

gpt-4 зображення документи скріншоти

OpenAIостання віха, нова модель GPT-4, може приймати запити, які містять зображення, документи з текстом, діаграми або знімки екрана як вхідні дані. Це значне покращення порівняно з попередньою версією, GPT-3, який міг лише розуміти та виводити текст. Завдяки цій новій функції GPT-4 генерує текстові виходи на основі вхідних даних, що складаються з вкраплення тексту та зображень.

«У ряді доменів, включаючи документи з текстом і фотографіями, діаграми або знімки екрана,GPT-4 демонструє такі ж можливості, як і при введенні лише тексту»,

OpenAI написав.

ChatGPT-4 має більший розмір, ніж його попередники, що вказує на те, що він пройшов навчання на більшій кількості даних і містить більше ваг у своєму файлі моделі, що призводить до вищих витрат на його роботу. Найновіша мова ШІ може генерувати текст, схожий на людину, використовуючи глибоке навчання і пройти попереднє навчання на великому наборі даних.

GPT-4 має продемонстрував кращу продуктивність порівняно з іншими мовами ШІ у різноманітних іспитах і тестах, частково завдяки його здатності отримати доступ до додаткової інформації та деталей через зображення, які можуть бути недоступні в письмовій формі.

Новий GPT-4 модель може підказати, що саме зображено на ілюстрації, проаналізувати її і навіть пояснити її значення. У демо, GPT-4 пояснив візуальний жарт, коли кабель VGA підключається до iPhone. Це також може пояснити, що незвичайного на зображенні, яке демонструє «екстремальне прасування», яке ви можете переглянути нижче.

gpt-4 зображень
джерело: OpenAI

Однак є й більш корисні наслідки GPT-4нові знання. У презентації було показано, що PGT-4 може підказати, що можна приготувати з інгредієнтів, зображених на картинці. Це означає, що модель може допомогти вам готувати, якщо у вас є продукти, і ви не знаєте, що з ними робити. Зробіть знімок їжі, яку ви маєте, і поспілкуйтесяGPT може підказати, що можна приготувати з інгредієнтів, які є у вас вдома.

Ця здатність розуміти та інтерпретувати візуальну інформацію робить GPT-4 потужний інструмент для таких завдань, як підписи до зображень, візуальні відповіді на запитання та навіть створення вмісту. Завдяки інтеграції тексту та візуального розуміння, GPT-4 має потенціал революціонізувати різні галузі, такі як реклама, дизайн та електронна комерція, і допомогти людям виконувати нудні, буденні завдання замість них.

Передова мовна модель також «розуміє» знімки екрана та документи з текстом, таблицями, діаграмами чи іншими візуальними представленнями. Наприклад, якщо ви завантажуєте тристорінкову дослідницьку статтю і вам потрібно її підсумувати та пояснити, GPT-4 здатний це зробити. 

Ведучий Bloomberg Джон Ерліхман продемонстрував, як він зміг перетворити намальований вручну дизайн на функціональний веб-сайт.

Нова технологія також може бути використана як допомога в пересуванні, оскільки її можна використовувати для опису середовища для людей з вадами зору. З цією метою Open AI вже співпрацює з додатком під назвою Будь моїми очима який був розроблений, щоб надати незрячим руку допомоги, коли їм потрібно щось подивитися, наприклад, під час покупки продуктів. Додаток дозволяє «зрячим волонтерам і професіоналам використовувати свої очі для вирішення великих і малих завдань, щоб допомогти сліпим і людям зі слабким зором вести більш незалежне життя». Тепер він також пропонує віртуальний волонтерський інструмент на основі OpenAIАвтора GPT-4.

хоча OpenAIАвтора GPT-4 на даний момент пропонує можливість обробки тексту та зображень як вхідних даних, модель ще не обладнана для обробки аудіо та відео вводів. Тим не менш, є ознаки того, що ці модальності можуть бути включені в наступну ітерацію технології.

Детальніше:

Ключові слова:

відмова

Відповідно до Правила проекту Trust, будь ласка, зверніть увагу, що інформація, надана на цій сторінці, не призначена і не повинна тлумачитися як юридична, податкова, інвестиційна, фінансова або будь-яка інша форма консультації. Важливо інвестувати лише те, що ви можете дозволити собі втратити, і звернутися за незалежною фінансовою порадою, якщо у вас виникнуть сумніви. Щоб отримати додаткову інформацію, ми пропонуємо звернутися до положень та умов, а також до сторінок довідки та підтримки, наданих емітентом або рекламодавцем. MetaversePost прагне до точного, неупередженого звітування, але ринкові умови можуть змінюватися без попередження.

про автора

Агне — журналістка, яка висвітлює останні тенденції та події в метавсесвіті, ШІ та Web3 промисловості для Metaverse Post. Її пристрасть до оповідання привела її до численних інтерв’ю з експертами в цих галузях, завжди прагнучи розкрити захоплюючі та привабливі історії. Агне має ступінь бакалавра літератури та має великий досвід написання текстів на різноманітні теми, включаючи подорожі, мистецтво та культуру. Вона також була волонтером редактора організації з прав тварин, де допомагала підвищувати обізнаність про проблеми добробуту тварин. Зв'яжіться з нею [захищено електронною поштою].

інші статті
Агне Цимерман
Агне Цимерман

Агне — журналістка, яка висвітлює останні тенденції та події в метавсесвіті, ШІ та Web3 промисловості для Metaverse Post. Її пристрасть до оповідання привела її до численних інтерв’ю з експертами в цих галузях, завжди прагнучи розкрити захоплюючі та привабливі історії. Агне має ступінь бакалавра літератури та має великий досвід написання текстів на різноманітні теми, включаючи подорожі, мистецтво та культуру. Вона також була волонтером редактора організації з прав тварин, де допомагала підвищувати обізнаність про проблеми добробуту тварин. Зв'яжіться з нею [захищено електронною поштою].

Hot Stories
Приєднуйтеся до нашої розсилки.
Останні новини

Настав день винесення вироку: суд США розглядає прохання Міністерства юстиції щодо долі CZ.

Changpeng Zhao готовий зіткнутися з вироком у американському суді в Сіетлі сьогодні.

Дізнайтеся більше

Засновників гаманця Samourai Wallet звинувачують у сприянні угодам у Darknet на суму 2 мільярди доларів

Занепокоєння засновників гаманця Samourai Wallet є помітною невдачею для галузі, підкреслюючи постійне...

Дізнайтеся більше
Приєднуйтесь до нашої спільноти інноваційних технологій
Детальніше
Читати далі
Chainlink і Rapid Addition співпрацюють для розробки блокчейн-адаптера на основі CCIP
Business Звіт про новини Технологія
Chainlink і Rapid Addition співпрацюють для розробки блокчейн-адаптера на основі CCIP
Травень 1, 2024
BitSmiley запускає Alphanet V1, дебютує на Bitcoin Layer 2 Network Bitlayer
Звіт про новини Технологія
BitSmiley запускає Alphanet V1, дебютує на Bitcoin Layer 2 Network Bitlayer
Травень 1, 2024
У квітні 2024 року кількість хаків і шахрайства досягла історичного мінімуму, CertiK повідомляє про зниження на 141% порівняно з березнем
ринки Безпека Wiki Розповіді та огляди Технологія
У квітні 2024 року кількість хаків і шахрайства досягла історичного мінімуму, CertiK повідомляє про зниження на 141% порівняно з березнем
Травень 1, 2024
Ціна біткойна падає напередодні рішення Федеральної резервної системи про відсоткову ставку, аналітики попереджають про потенційні зміни ринку
ринки Звіт про новини Технологія
Ціна біткойна падає напередодні рішення Федеральної резервної системи про відсоткову ставку, аналітики попереджають про потенційні зміни ринку
Травень 1, 2024
CRYPTOMERIA LABS PTE. LTD.