文本網格:一個新的 Stable Diffusion-來自 Google 的基於文本到 3D 的模型
簡單來說
TextMesh 是 Google 的一項新的文本到 3D 作品,改進了現在流行的使用方法 Stable Diffusion 生成相同基本提示(2D 圖片)的不同角度,然後使用 NeRF 從中組裝 3D 網格。
最近,由於擴散圖像生成模型的工作,從文本提示生成 2D 圖像的能力取得了巨大成功。 這些模型非常有能力在給定文本提示的情況下生成高質量的圖像樣本,從而實現簡單的文本到圖像的界面。 基於 2D 圖像生成領域的這些進步,這個行業的一個大問題是是否可以應用類似的擴散模型從文本生成 3D 模型。
現在谷歌推出了一種新的文本到 3D 方法,名字很漂亮 文本網格。 這種方法有望改進現在流行的方法 Stable Diffusion基於 文本到 3D 模型 一代。 其核心是通過將基本 2D 輸入輸入模型來生成多個角度。 然後使用神經輻射場 (NeRF) 方法處理結果並將其同化到 3D 網格中。
推薦: 提示工程終極指南 2023: |
與當前流行的 DreamFusion 和 CLIPMesh 相比,這種創新方法的優勢首先在於用戶友好的輸出。 TextMesh 沒有使用具有挑戰性的 NeRF 格式,而是提供帶有紋理的 3D 網格,從而使其更適用於現實世界的使用。 此外,該方法避免了其他模型經常遇到的高飽和度效應,並設法增加了細節。
模型作品 首先在 NeRF 的幫助下從輸入圖像形成 3D 網格。 然後將結果通過 SDF(Signed Distance Fields)框架進一步細化紋理,提高輸出網格的整體清晰度。 更不用說,SDF 框架有助於避免其他 3D 的過飽和效果 模型 通常患有。
作為示例創建的 3D 網格
這種方法利用了 DiG 模型的成功,並將 NeRF 網絡擴展為基於 SDF 骨幹網。 與之前討論的方法相比,這會產生改進的 3D 網格提取能力和更加逼真的 3D 網格。
使用 TextMesh 的結果非常有說服力。 作者甚至提供了一張使用他們的模型創建的松鼠圖片的鏈接,這簡直令人印象深刻。
TextMesh 證明了自己是一種革命性的新 3D 模型,它提供了大量的優勢並且可以生成極其逼真的 3D 網格。 它的使用必將在不久的將來變得越來越流行。
閱讀有關人工智能的更多信息:
免責聲明
在與線 信託專案指南,請注意,本頁提供的資訊無意且不應被解釋為法律、稅務、投資、財務或任何其他形式的建議。 重要的是,僅投資您可以承受損失的金額,並在有任何疑問時尋求獨立的財務建議。 如需了解更多信息,我們建議您參閱條款和條件以及發行人或廣告商提供的幫助和支援頁面。 MetaversePost 致力於提供準確、公正的報告,但市場狀況如有變更,恕不另行通知。
關於作者
Damir 是團隊領導、產品經理和編輯 Metaverse Post,涵蓋 AI/ML、AGI、LLM、Metaverse 等主題 Web3- 相關領域。 他的文章每月吸引超過一百萬用戶的大量讀者。 他似乎是一位在 SEO 和數字營銷方面擁有 10 年經驗的專家。 達米爾曾在 Mashable、Wired、 Cointelegraph、《紐約客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作為數字游牧者往返於阿聯酋、土耳其、俄羅斯和獨聯體國家之間。 達米爾獲得了物理學學士學位,他認為這賦予了他在不斷變化的互聯網格局中取得成功所需的批判性思維技能。
更多文章Damir 是團隊領導、產品經理和編輯 Metaverse Post,涵蓋 AI/ML、AGI、LLM、Metaverse 等主題 Web3- 相關領域。 他的文章每月吸引超過一百萬用戶的大量讀者。 他似乎是一位在 SEO 和數字營銷方面擁有 10 年經驗的專家。 達米爾曾在 Mashable、Wired、 Cointelegraph、《紐約客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作為數字游牧者往返於阿聯酋、土耳其、俄羅斯和獨聯體國家之間。 達米爾獲得了物理學學士學位,他認為這賦予了他在不斷變化的互聯網格局中取得成功所需的批判性思維技能。