GPT-4 可以處理您對圖像、文件、圖表和螢幕截圖的請求
簡單來說
GPT-4 可以處理圖像、文件、圖表和螢幕截圖的請求。 這是一個改進 GPT-3,它只處理文字。
GPT-4 在各種考試和測試中具有出色的表現,並且可以透過圖像存取可能無法以書面形式獲得的附加資訊和詳細資訊。
OpenAI最新里程碑,新車型 GPT-4,可以接受包含圖像、帶有文字的文檔、圖表或螢幕截圖作為輸入的請求。 這比之前的版本有了顯著的改進, GPT-3,它只能理解並輸出文字。 有了這個新功能, GPT-4 給定由散佈的文字和圖像組成的輸入,產生文字輸出。
「在一系列領域——包括帶有文字和照片、圖表或螢幕截圖的文件——GPT-4 表現出與純文字輸入類似的功能,”
OpenAI 中寫道。
ChatGPT-4 其尺寸比其前身更大,這表明它接受了更大量的資料訓練,並且模型檔案中包含更多的權重,從而導致其運行成本更高。 最新的人工智慧語言可以透過使用來產生類似人類的文本 深入學習 並在大型數據集上進行預訓練。
GPT-4 有 表現出優於其他人工智能語言的性能 在各種考試和測試中,部分原因是它能夠通過可能無法以書面形式提供的圖像訪問其他信息和詳細信息。
新的 GPT-4 模型可以告訴你插圖中到底描繪了什麼,分析它,甚至解釋它的意義。 在演示中, GPT-4 解釋了 VGA 線連接到 iPhone 的視覺笑話。 它還可以解釋顯示“極端熨燙”的圖片中的異常情況,您可以在下面查看。
然而,還有更有用的含義 GPT-4的新發現的知識。 演示中表明,PGT-4 可以根據圖中所示的成分判斷出可以烹飪什麼。 這意味著如果您有食品但不知道如何處理它們,該模型可以幫助您烹飪。 給你的食物拍一張快照,然後聊天-GPT 可以告訴您可以用家裡的原料做什麼。
這種理解和解釋視覺訊息的能力使得 GPT-4 一個強大的工具,用於執行圖像字幕、視覺問答、甚至內容創建等任務。 透過文字和視覺理解的結合, GPT-4 有潛力徹底改變廣告、設計和電子商務等各個行業,並幫助人們完成枯燥、平凡的任務。
先進的 語言模型 還可以「理解」帶有文字、表格、圖表或其他視覺表示形式的螢幕截圖和文件。 例如,如果您上傳一篇三頁的研究論文並需要對其進行總結和解釋, GPT-4 是有能力這樣做的。
Bloomberg 的主播 Jon Erlichman 展示了他如何將手繪設計轉變為功能性網站。
這項新技術還可以用作助行器,因為它可以用來為視障人士描述環境。 為此,Open AI 已經與一個名為 成為我的眼睛 它的目的是在盲人需要看東西時(例如在雜貨店購物時)向他們伸出援助之手。 該應用程序讓“有視力的志願者和專業人士用他們的眼睛來解決大大小小的任務,以幫助盲人和弱視人士過上更獨立的生活。” 現在,它還提供了一個虛擬志願者工具,由 OpenAI“ GPT-4.
雖然 OpenAI“ GPT-4 目前提供了處理文字和圖像作為輸入的能力,但該模型尚未具備處理音訊和視訊輸入的能力。 儘管如此,有跡象表明這些模式可能會包含在該技術的下一個迭代中。
閱讀更多:
- 採用的前 7 家公司 GPT-4
- GPT-4基於 ChatGPT 性能優於 GPT-3 570 倍
- 微軟確認 Bing 可在 Advanced 上運行 GPT-4 型號
- GPT-4 與 GPT-3:新車型有什麼特色?
免責聲明
在與線 信託專案指南,請注意,本頁提供的資訊無意且不應被解釋為法律、稅務、投資、財務或任何其他形式的建議。 重要的是,僅投資您可以承受損失的金額,並在有任何疑問時尋求獨立的財務建議。 如需了解更多信息,我們建議您參閱條款和條件以及發行人或廣告商提供的幫助和支援頁面。 MetaversePost 致力於提供準確、公正的報告,但市場狀況如有變更,恕不另行通知。
關於作者
Agne 是一名記者,負責報導虛擬宇宙、人工智能和人工智能領域的最新趨勢和發展。 Web3 行業為 Metaverse Post。 她對講故事的熱情促使她對這些領域的專家進行了大量採訪,總是試圖發現令人興奮和引人入勝的故事。 Agne 擁有文學學士學位,在旅行、藝術和文化等廣泛主題的寫作方面擁有豐富的背景。 她也志願擔任動物權利組織的編輯,幫助提高人們對動物福利議題的認識。 聯繫她 [電子郵件保護].
更多文章Agne 是一名記者,負責報導虛擬宇宙、人工智能和人工智能領域的最新趨勢和發展。 Web3 行業為 Metaverse Post。 她對講故事的熱情促使她對這些領域的專家進行了大量採訪,總是試圖發現令人興奮和引人入勝的故事。 Agne 擁有文學學士學位,在旅行、藝術和文化等廣泛主題的寫作方面擁有豐富的背景。 她也志願擔任動物權利組織的編輯,幫助提高人們對動物福利議題的認識。 聯繫她 [電子郵件保護].