分析 新聞報導 專業技術
2023 年 9 月 06 日

拉瓦 vs. GPT-4:一場開源人工智慧對決,凸顯多模式潛力與數學局限性

在最近的發布會上 GPT-4,其突出的功能之一是它能夠進行富含圖像的對話。 然而,該功能尚未整合到 OpenAI的奉獻。 雖然我們之前強調過 Bing在這方面的能力現在,一個開源解決方案以“大語言和視覺助手”的形式出現了(拉瓦).

數學挑戰:LLaVA 的開源 AI 陷入困境,與此不同 GPT-4

LLaVA 的多式聯運潛力

LLaVA 是一種結合了語言和視覺處理的開源多模式人工智能。 可以訪問 LLaVA 的演示 請點擊這裡.

這張照片的奇怪之處在於,一名男子從一輛黃色出租車的車窗探出身子,手裡拿著一根晾衣繩,上面掛著一件白襯衫。 這種情況很不尋常,因為很少看到人們抱著衣服或內衣探出車窗。 當出租車行駛時,該男子可能試圖以不安全且低效的方式烘乾襯衫。

我們通過輸入出租車和人的圖片進行了簡單的測試,LLaVA 為我提供了描述性分析。 然而,我嘗試用數學問題來挑戰它,類似於 Bing 解決的問題,但事實證明是徒勞的。 儘管 LLaVA 擅長圖像識別,但它似乎在數學方面遇到了困難。

數學任務的挑戰

我們向 LLaVA 提出了一個涉及三角學的數學問題,類似於 Bing 成功解決的問題。 不幸的是,LLaVA 無法提供正確的解決方案,將 169 的平方根返回為 13.2 的錯誤答案。

我們來解決這個查詢

當前的任務涉及確定邊長分別為 5 厘米和 12 厘米的三角形的對角線長度。 為了實現這一點,我們可以利用畢達哥拉斯定理,該定理指出,在直角三角形中,斜邊(與直角相對的邊)長度的平方等於其他兩條邊的平方和。

在這種情況下,斜邊對應於三角形的對角線,我們可以通過取兩個給定邊的平方和的平方根來確定。

首先,我們必須找到對角線的長度,它是連接三角形的兩個不相鄰頂點的邊。 在本例中,這兩個頂點與尺寸為 5 厘米和 12 厘米的邊相關聯。

現在,讓我們應用畢達哥拉斯定理:

(5 厘米)^2 + (12 厘米)^2 = 對角線^2

5^2 + 12^2 = 對角線^2

25 + 144 = 對角線^2

169 = 對角線^2

最後,我們可以通過兩邊的平方根來確定對角線的長度:

√169 = 對角線

對角線的長度約為13.2厘米。

不尋常的圖像視角

儘管挑戰依然存在,特別是在數學問題解決方面,LLaVA 仍擅長與圖像交互的能力。 例如,當看到一名男子從黃色出租車車窗外探出身子、手持晾衣繩、身穿白襯衫時,LLaVA 提供了一個不尋常的視角。 它表明這樣的場景並不典型,因為看到有人拿著衣服探出車窗的情況並不常見。 分析表明,該男子可能正在嘗試一種非常規且可能不安全的方法,在出租車行駛時烘乾襯衫。

雖然 LLaVA 提供了有前途的多模態功能,特別是在與圖像對話方面,但它在解決數學問題方面面臨著局限性。 值得注意的是,谷歌在這方面的能力超越了 LLaVA,對類似數學問題的更準確的解決方案就證明了這一點。

具有多模式功能的人工智能的發展無疑是一個令人興奮的進步,LLaVA 是這個方向上值得稱讚的開源成果。 然而,需要改進以增強其數學能力 推理能力 以匹配其在圖像分析方面的熟練程度。

對於更準確的數學解決方案,目前 Google 的能力較為優越: Google 的數學問題解決器.

閱讀有關人工智能的更多信息:

免責聲明

在與線 信託專案指南,請注意,本頁提供的資訊無意且不應被解釋為法律、稅務、投資、財務或任何其他形式的建議。 重要的是,僅投資您可以承受損失的金額,並在有任何疑問時尋求獨立的財務建議。 如需了解更多信息,我們建議您參閱條款和條件以及發行人或廣告商提供的幫助和支援頁面。 MetaversePost 致力於提供準確、公正的報告,但市場狀況如有變更,恕不另行通知。

關於作者

Damir 是團隊領導、產品經理和編輯 Metaverse Post,涵蓋 AI/ML、AGI、LLM、Metaverse 等主題 Web3- 相關領域。 他的文章每月吸引超過一百萬用戶的大量讀者。 他似乎是一位在 SEO 和數字營銷方面擁有 10 年經驗的專家。 達米爾曾在 Mashable、Wired、 Cointelegraph、《紐約客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作為數字游牧者往返於阿聯酋、土耳其、俄羅斯和獨聯體國家之間。 達米爾獲得了物理學學士學位,他認為這賦予了他在不斷變化的互聯網格局中取得成功所需的批判性思維技能。 

更多文章
達米爾亞拉洛夫
達米爾亞拉洛夫

Damir 是團隊領導、產品經理和編輯 Metaverse Post,涵蓋 AI/ML、AGI、LLM、Metaverse 等主題 Web3- 相關領域。 他的文章每月吸引超過一百萬用戶的大量讀者。 他似乎是一位在 SEO 和數字營銷方面擁有 10 年經驗的專家。 達米爾曾在 Mashable、Wired、 Cointelegraph、《紐約客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作為數字游牧者往返於阿聯酋、土耳其、俄羅斯和獨聯體國家之間。 達米爾獲得了物理學學士學位,他認為這賦予了他在不斷變化的互聯網格局中取得成功所需的批判性思維技能。 

Hot Stories

建立在 EigenLayer 之上的前 5 個液體重新抵押協議

by 安東尼·索洛弗
2024 年 5 月 17 日
加入我們的時事通訊。
最新消息

建立在 EigenLayer 之上的前 5 個液體重新抵押協議

by 安東尼·索洛弗
2024 年 5 月 17 日

從 Ripple 到大型綠色 DAO:加密貨幣專案如何為慈善事業做出貢獻

讓我們探索利用數位貨幣潛力進行慈善事業的措施。

了解更多

AlphaFold 3、Med-Gemini 等:2024 年人工智慧改變醫療保健的方式

人工智慧在醫療保健領域有多種表現形式,從發現新的遺傳相關性到增強機器人手術系統的能力…

了解更多
加入我們的創新技術社區
了解更多
阅读更多
Alchemy Pay 與 BounceBit 合作支援比特幣重新抵押生態系統
購物 新聞報導 專業技術
Alchemy Pay 與 BounceBit 合作支援比特幣重新抵押生態系統
2024 年 5 月 17 日
建立在 EigenLayer 之上的前 5 個液體重新抵押協議
消化 市場 軟體 專業技術
建立在 EigenLayer 之上的前 5 個液體重新抵押協議
2024 年 5 月 17 日
Magic Square 推出 IDO 平台 Magic Launchpad,以實現零售存取民主化 Web3 投資者
購物 市場 新聞報導
Magic Square 推出 IDO 平台 Magic Launchpad,以實現零售存取民主化 Web3 投資者
2024 年 5 月 17 日
幣安與台灣當局合作揭露價值 6 萬美元的大規模加密貨幣洗錢案
意見 購物 市場 軟體 專業技術
幣安與台灣當局合作揭露價值 6 萬美元的大規模加密貨幣洗錢案
2024 年 5 月 17 日