ニュースレポート テクノロジー
2023 年 3 月 15 日

GPT-4 画像、ドキュメント、図、スクリーンショットのリクエストに対応できます

簡単に言えば

GPT-4 画像、ドキュメント、図、スクリーンショットのリクエストを処理できます。 以上の改善です GPT-3、テキストのみを処理しました。

GPT-4 さまざまな試験やテストで優れた成績を収めており、書面では入手できない追加情報や詳細情報に画像を通じてアクセスできます。

gpt-4 画像 ドキュメント スクリーンショット

OpenAIの最新マイルストーンとなる新モデル GPT-4、画像、テキストを含むドキュメント、図、またはスクリーンショットを入力として含むリクエストを受け入れることができます。 これは、以前のバージョンに比べて大幅な改善を示しています。 GPT-3、テキストを理解して出力することしかできませんでした。 この新機能により、 GPT-4 点在するテキストと画像で構成される入力を指定して、テキスト出力を生成します。

「テキストと写真、図、スクリーンショットを含む文書など、さまざまな領域にわたって」GPT-4 テキストのみの入力と同様の機能を発揮します。」

OpenAI 書きました。

ChatGPT-4 は、以前のバージョンよりもサイズが大きくなっており、より大量のデータでトレーニングを受けており、モデル ファイルに含まれる重みがより多くなっているため、操作コストが高くなっていることがわかります。 最新の AI 言語は、以下を使用して人間のようなテキストを生成できます。 深い学習 そして大規模なデータセットで事前トレーニングされています。

GPT-4 持っています 他の AI 言語よりも優れたパフォーマンスを示した 書面では入手できない可能性がある画像を介して追加情報や詳細にアクセスできるため、さまざまな試験やテストで使用されます。

新しい GPT-4 モデルは、イラストに何が描かれているかを正確に伝え、分析し、さらにはその意味を説明することができます。 デモでは、 GPT-4 VGA ケーブルが iPhone に接続されているという視覚的なジョークを説明しました。 また、「極端なアイロンがけ」を示す写真の何が異常であるかを説明することもできます。以下で確認できます。

gpt-4 画像
情報源: OpenAI

ただし、さらに有益な意味もあります。 GPT-4の新たな知識。 プレゼンテーションでは、PGT-4が写真に示された材料から何が調理できるかを判断できることが示されました。 これは、食品があり、それをどうすればよいかわからない場合に、このモデルが料理を助けることができることを意味します。 あなたが持っている食べ物のスナップショットを撮って、チャットしてください。GPT 家にある材料で何が作れるか教えてください。

視覚情報を理解し解釈するこの能力により、 GPT-4 画像のキャプション、視覚的な質問への回答、さらにはコンテンツ作成などのタスクのための強力なツールです。 テキストと視覚的な理解の両方を統合することで、 GPT-4 は、広告、デザイン、電子商取引などのさまざまな業界に革命を起こし、人々が退屈で平凡なタスクを実行できるようにする可能性を秘めています。

高度な 言語モデル また、スクリーンショットや、テキスト、表、図、その他の視覚的表現を含むドキュメントも「理解」します。 たとえば、XNUMX ページの研究論文をアップロードし、それを要約して説明する必要がある場合、次のようにします。 GPT-4 そうすることができます。 

Bloomberg のアンカーである Jon Erlichman は、手書きのデザインを機能的な Web サイトに変える方法を実演しました。

この新技術は、視覚障害者の環境を説明するために使用できるため、移動補助としても使用できます。 この目的のために、Open AI はすでに次のアプリケーションと提携しています。 私の目になる これは、視覚障害者が食料品の買い物中など、何かを見る必要があるときに手を差し伸べられるように設計されています。 このアプリを使用すると、「目の見えるボランティアや専門家が目を貸して大小の課題を解決し、視覚障害者や弱視の人がより自立した生活を送れるよう支援する」ことができます。 現在では、以下を活用した仮想ボランティア ツールも提供しています。 OpenAIさん GPT-4.

しかし OpenAIさん GPT-4 は現在、テキストと画像を入力として処理する機能を提供していますが、このモデルにはオーディオとビデオの入力を処理する機能がまだ装備されていません。 それにもかかわらず、これらのモダリティが技術の次の反復に含まれる可能性があるという兆候があります。

続きを読む:

免責事項

に沿って トラストプロジェクトのガイドライン, このページで提供される情報は、法律、税金、投資、財務、またはその他の形式のアドバイスを目的としたものではなく、そのように解釈されるべきではないことに注意してください。 損失しても許容できる金額のみを投資し、疑問がある場合は独立した財務上のアドバイスを求めることが重要です。 詳細については、利用規約のほか、発行者または広告主が提供するヘルプおよびサポート ページを参照することをお勧めします。 MetaversePost は正確で公平なレポートに努めていますが、市場の状況は予告なく変更される場合があります。

著者について

アグネは、メタバース、AI、およびメタバースの最新のトレンドと開発をカバーするジャーナリストです。 Web3 のための産業 Metaverse Post。 ストーリーテリングに対する彼女の情熱により、これらの分野の専門家に数多くのインタビューを実施し、常にエキサイティングで魅力的なストーリーを明らかにしようと努めています。 アグネは文学の学士号を取得しており、旅行、芸術、文化など幅広いトピックについて執筆する幅広い経歴を持っています。 彼女は動物愛護団体の編集者としてもボランティアとして参加し、動物福祉問題についての意識を高めることに貢献しました。 彼女に連絡する [メール保護].

より多くの記事
アグネ・シメルマン
アグネ・シメルマン

アグネは、メタバース、AI、およびメタバースの最新のトレンドと開発をカバーするジャーナリストです。 Web3 のための産業 Metaverse Post。 ストーリーテリングに対する彼女の情熱により、これらの分野の専門家に数多くのインタビューを実施し、常にエキサイティングで魅力的なストーリーを明らかにしようと努めています。 アグネは文学の学士号を取得しており、旅行、芸術、文化など幅広いトピックについて執筆する幅広い経歴を持っています。 彼女は動物愛護団体の編集者としてもボランティアとして参加し、動物福祉問題についての意識を高めることに貢献しました。 彼女に連絡する [メール保護].

Hot Stories

BRICS 諸国向けステーブルコイン取引ソリューション

by ヴィクトリア・パルチク
2024 年 5 月 01 日
ニュースレターにご参加ください。
最新ニュース

量刑の日が到来:米国裁判所が司法省の申し立てを検討する中、CZの運命は均衡を保っている

Changpeng Zhao氏は本日、シアトルの米国裁判所で判決を受ける予定である。

詳細を知りたい

Samourai Wallet創設者、ダークネット取引で2億ドルを仲介したとして告発

Samourai Wallet 創設者の懸念は業界にとって顕著な後退を表しており、永続的な問題を浮き彫りにしています。

詳細を知りたい
革新的なテクノロジー コミュニティに参加してください
続きを読む
続きを読む
Ankr、AIブロックチェーンプラットフォームTalus Networkと連携し、AI向けビットコインの流動性を解放
ビジネス ニュースレポート テクノロジー
Ankr、AIブロックチェーンプラットフォームTalus Networkと連携し、AI向けビットコインの流動性を解放
2024 年 5 月 1 日
Binance Labs、ブロックチェーン全体での Facebook の Move 統合を促進するために Movement Labs をサポート
ビジネス ニュースレポート テクノロジー
Binance Labs、ブロックチェーン全体での Facebook の Move 統合を促進するために Movement Labs をサポート
2024 年 5 月 1 日
BRICS 諸国向けステーブルコイン取引ソリューション
ビジネス マーケット ストーリーとレビュー テクノロジー
BRICS 諸国向けステーブルコイン取引ソリューション
2024 年 5 月 1 日
ビットコイン L2 ネットワーク BOB が LayerZero と統合され、機能が強化
ビジネス ニュースレポート テクノロジー
ビットコイン L2 ネットワーク BOB が LayerZero と統合され、機能が強化
2024 年 5 月 1 日
CRYPTOMERIA LABS PTE。 株式会社。