Meta 推出 Segment Anything,其用於圖像分割的新 AI 模型
簡單來說
Meta 推出了 Segment Anything,這是其用於圖像分割的新基礎模型。
該公司正在開源兩個用於訓練 AI 模型的大型數據集。
Meta 說 Segment Anything 可以成為更大的人工智能係統的一個組成部分 理解視覺和文本內容 的一個網頁。
Meta 推出了 Segment Anything,這是其用於圖像分割的新基礎模型。 識別哪些圖像像素屬於對象的過程是計算機視覺中的一項關鍵任務,並用於從分析科學圖像到編輯照片的各種應用程序。
在它的介紹中 博客文章,該公司表示,為計算機視覺中的特定任務創建準確的分割模型通常需要技術專家的專業工作,他們可以訪問 AI 培訓基礎設施和大量經過仔細註釋的域內數據。
然而,這可能很快會隨著 Segment Anything 項目而改變,因為它的新數據集和模型有望使更廣泛的受眾更容易獲得準確的分割模型,從而消除對專業技術專長和基礎設施的需求。 為實現這一目標,研究人員構建了一個可提示模型,該模型經過不同數據的訓練,可以適應特定任務,類似於在自然語言處理模型或聊天機器人中使用提示的方式。
為了進一步使分割民主化,Meta 正在使大量 SA-1B 數據集可用於研究目的,並且 Segment Anything Model 在開放許可 (Apache 2.0) 下可用。 此外,該公司還開發了一種 演示 允許用戶使用自己的圖像嘗試 SAM。
Meta 看到了 SAM 在 AI、AR/VR 和創作者領域的潛在用例。 SAM 有可能成為更大的人工智能係統中的關鍵元素,這些系統旨在實現對世界的更普遍的多模態理解。 例如,它可以促進網頁上視覺和文本內容的理解。
此外,在 AR/VR 領域,SAM 可以根據用戶的視線選擇對象,並允許將對象“提升”為 3D。 此外,內容創作者可以使用 SAM 來增強創意應用,例如提取圖像區域以進行拼貼或視頻編輯。
在生成式人工智能的繁榮和人們對元宇宙的興趣減弱的背景下,Meta 一直在加大人工智能方面的努力。 儘管該公司在虛擬宇宙上押注了 70 億美元,但其虛擬宇宙部門 Reality Labs 去年卻虧損了 13.7 億美元。 最近,Meta 也日落了 NFT Facebook 和 Instagram 上的運營。
在接受記者採訪時 日經亞洲 週三,Meta 首席技術官 Chris Bosworth 表示,Meta 的高層管理人員大部分時間都花在了 AI 上。 Meta 首席執行官馬克扎克伯格 宣布 XNUMX 月,一個專注於生成 AI 的新產品組 釋放 其新的大型語言模型稱為 LLaMA (大型語言模型元人工智慧)。
博斯沃思告訴日經新聞,預計該公司今年將推出一些廣告製作人工智能應用程序。
閱讀更多:
免責聲明
在與線 信託專案指南,請注意,本頁提供的資訊無意且不應被解釋為法律、稅務、投資、財務或任何其他形式的建議。 重要的是,僅投資您可以承受損失的金額,並在有任何疑問時尋求獨立的財務建議。 如需了解更多信息,我們建議您參閱條款和條件以及發行人或廣告商提供的幫助和支援頁面。 MetaversePost 致力於提供準確、公正的報告,但市場狀況如有變更,恕不另行通知。
關於作者
辛迪是一名記者 Metaverse Post,涵蓋相關主題 web3, NFT、元宇宙和人工智能,重點是採訪 Web3 行業參與者。她曾與 30 多位 C 級高管進行過交談,並將他們的寶貴見解帶給讀者。辛蒂來自新加坡,現居住在喬治亞第比利斯。她擁有南澳大利亞大學傳播與媒體研究學士學位,並擁有十年的新聞和寫作經驗。透過以下方式與她聯繫 [電子郵件保護] 有新聞發布會、公告和採訪機會。
更多文章辛迪是一名記者 Metaverse Post,涵蓋相關主題 web3, NFT、元宇宙和人工智能,重點是採訪 Web3 行業參與者。她曾與 30 多位 C 級高管進行過交談,並將他們的寶貴見解帶給讀者。辛蒂來自新加坡,現居住在喬治亞第比利斯。她擁有南澳大利亞大學傳播與媒體研究學士學位,並擁有十年的新聞和寫作經驗。透過以下方式與她聯繫 [電子郵件保護] 有新聞發布會、公告和採訪機會。