Luma推出Uni-1,這是其首款整合推理和圖像生成的模型。
簡單來說
Luma 推出了 Uni-1,這是其首款將推理和圖像生成結合在一個架構中的模型——這與這家專注於影片的新創公司的起源截然不同。
AI影片生成新創公司 亮度 推出了 Uni-1,這是該公司首款將推理和圖像生成整合到單一架構中的模型,標誌著該公司從先前專注於視訊內容的策略轉變。
據該公司稱,過去三年,Luma 的工作已從場景重建發展到 3D 生成和視訊擴散規模化,但僅憑視覺媒體本身,缺乏整合理解,存在局限性。 Uni-1 是該公司首個旨在融合推理和生成能力的統一模型,旨在推動多模態通用智慧的發展。
Luma 將通用智能定義為推理、想像、操控符號和模擬環境的能力。雖然現有的 AI 系統可以分別執行這些功能,但 Uni-1 旨在將它們整合到一個統一的框架中,對時間、空間和邏輯進行建模,從而實現傳統分段式流程無法解決的問題。
該模型建構成一個僅包含解碼器的自回歸Transformer,將文字和圖像表示在一個交錯的序列中,該序列既作為輸入又作為輸出。 Uni-1能夠執行結構化的內部推理,分解指令,解決約束,規劃構圖,並據此渲染圖像。
Uni-1展現了「以語言思考,以像素想像和渲染」的能力,Luma將其描述為「像素智能」。預計後續版本將增加音訊和視訊生成等其他輸出功能。此模型的目標不僅是作為工具,更是一個平台,透過將推理直接整合到創意工作流程中,從而變革企業的運作方式。
Luma Agents 擴展統一智能
基於 Uni-1,Luma 最近推出了 Luma Agents,這是一套人工智慧驅動的工具,旨在處理跨文字、圖像、視訊和音訊的端到端創意製作流程。這些代理人使用 Luma 的統一智慧模型系列,這些模型基於單一的多模態推理系統進行訓練。 Luma 將 Luma Agents 定位為廣告公司、行銷團隊、設計工作室和企業客戶的解決方案,可實現跨多種模態的協同創意產生。
Luma Agents 與其他 AI 模型相容,包括 Luma 的 Ray 3.14、Google 的 Veo 3 和 Nano Banana Pro、位元組跳動的 Seedream 以及 ElevenLabs 的語音產生工具。根據 Luma 執行長兼聯合創始人 Amit Jain 介紹,這些 Agents 利用了 Uni-1 的整合架構,該架構經過音訊、視訊、圖像、語言和空間推理方面的訓練,使其能夠在協調、智慧的工作流程中規劃、執行和生成內容。
免責聲明
在與線 信託專案指南,請注意,本頁提供的資訊無意且不應被解釋為法律、稅務、投資、財務或任何其他形式的建議。 重要的是,僅投資您可以承受損失的金額,並在有任何疑問時尋求獨立的財務建議。 如需了解更多信息,我們建議您參閱條款和條件以及發行人或廣告商提供的幫助和支援頁面。 MetaversePost 致力於提供準確、公正的報告,但市場狀況如有變更,恕不另行通知。
關於作者
Alisa,一位熱心記者 MPost專注於加密貨幣、人工智慧、投資以及廣闊的領域 Web3。她對新興趨勢和技術有著敏銳的洞察力,提供全面的報道,讓讀者了解並吸引讀者了解不斷發展的數位金融領域。
更多文章
Alisa,一位熱心記者 MPost專注於加密貨幣、人工智慧、投資以及廣闊的領域 Web3。她對新興趨勢和技術有著敏銳的洞察力,提供全面的報道,讓讀者了解並吸引讀者了解不斷發展的數位金融領域。



