A Luma bemutatja az Uni-1-et, az első modelljét, amely integrálja az érvelést és a képalkotást
Röviden
A Luma bemutatta az Uni-1-et, az első modelljét, amely egyetlen architektúrán belül ötvözi az érvelést és a képgenerálást – ezzel jelentős elmozdulást jelentve a videókra fókuszáló startup gyökereitől.
AI videógeneráló startup luma bemutatta az Uni-1-et, az első olyan modelljét, amely egyetlen architektúrán belül integrálja az érvelést és a képgenerálást, stratégiai elmozdulást jelezve a vállalat korábbi, videós tartalmakra összpontosító megközelítésétől.
A vállalat szerint az elmúlt három évben a Luma munkája a jelenetrekonstrukciótól a 3D-s generálásig és a videódiffúzió skálázásáig fejlődött, de a vizuális média önmagában is korlátokkal rendelkezik integrált megértés nélkül. Az Uni-1 a cég első egységes modelljeként pozicionálódik, amelyet az érvelési és a generatív képességek ötvözésére terveztek, a multimodális általános intelligencia előmozdítása érdekében.
Luma az általános intelligenciát úgy írja le, mint az érvelés, a képzelet, a szimbólumok manipulálása és a környezetek szimulálásának képességét. Míg a meglévő MI-rendszerek ezeket a funkciókat külön-külön is el tudják látni, az Uni-1 egyetlen keretrendszeren belül kívánja kombinálni őket, együtt modellezve az időt, a teret és a logikát, hogy lehetővé tegye a hagyományos, szegmentált rendszerekhez nem kapcsolódó problémamegoldást.
A modell egy kizárólag dekóderen alapuló autoregresszív transzformátorként épül fel, amely a szöveget és a képeket egyetlen összefonódó sorozatban ábrázolja, amely bemenetként és kimenetként is funkcionál. Az Uni-1 képes strukturált belső gondolkodásra, utasítások lebontására, korlátozások feloldására, kompozíció tervezésére és a képek ennek megfelelő renderelésére.
Az Uni-1 demonstrálja a „nyelvben való gondolkodás, valamint a pixelekben való elképzelés és renderelés” képességét, amelyet a Luma „pixelekben lévő intelligenciának” nevez. További kimenetek, beleértve a hang- és videógenerálást, várhatóan a későbbi kiadásokban is elérhetők lesznek. A modellt nemcsak eszközként, hanem egy olyan platformként is szánják, amely átalakítja a vállalkozások működését azáltal, hogy közvetlenül integrálja az érvelést a kreatív munkafolyamatokba.
A Luma ügynökök kiterjesztik az egységes intelligenciát
Az Uni-1-re építve a Luma nemrégiben piacra dobta a Luma Agents-et, egy mesterséges intelligencia által vezérelt eszközcsomagot, amelyet a szöveg, kép, videó és hanganyagok teljes körű kreatív előállítására terveztek. Az ágensek a Luma Unified Intelligence modellcsaládját használják, amelyeket egyetlen multimodális érvelési rendszeren képeznek ki. A Luma az ágenseket megoldásként pozicionálja reklámügynökségek, marketingcsapatok, designstúdiók és vállalati ügyfelek számára, összehangolt kreatív generálást kínálva több modalitáson keresztül.
A Luma ágensek kompatibilisek más MI-modellekkel, beleértve a Luma Ray 3.14-et, a Google Veo 3 és Nano Banana Pro rendszereit, a ByteDance Seedream-jét és az ElevenLabs hanggeneráló eszközeit. Amit Jain, a Luma vezérigazgatója és társalapítója szerint az ágensek az Uni-1 integrált architektúráját használják, amelyet hang-, videó-, kép-, nyelvi és térbeli gondolkodásra képeztek ki, lehetővé téve számukra a tartalom tervezését, végrehajtását és generálását egy összehangolt, intelligens munkafolyamatban.
Jogi nyilatkozat
Összhangban a A Trust Project irányelvei, kérjük, vegye figyelembe, hogy az ezen az oldalon közölt információk nem minősülnek jogi, adózási, befektetési, pénzügyi vagy bármilyen más formájú tanácsnak, és nem is értelmezhetők. Fontos, hogy csak annyit fektessen be, amennyit megengedhet magának, hogy elveszítsen, és kérjen független pénzügyi tanácsot, ha kétségei vannak. További információkért javasoljuk, hogy tekintse meg a szerződési feltételeket, valamint a kibocsátó vagy hirdető által biztosított súgó- és támogatási oldalakat. MetaversePost elkötelezett a pontos, elfogulatlan jelentéstétel mellett, de a piaci feltételek előzetes értesítés nélkül változhatnak.
A szerzőről
Alisa, a The MPost, kriptovalutákra, mesterséges intelligenciára, befektetésekre és a világ kiterjedt területére specializálódott Web3. Élénk szemmel figyeli a feltörekvő trendeket és technológiákat, ezért átfogó tájékoztatást nyújt, hogy tájékoztassa és bevonja olvasóit a digitális pénzügyek folyamatosan fejlődő világába.
További cikkek
Alisa, a The MPost, kriptovalutákra, mesterséges intelligenciára, befektetésekre és a világ kiterjedt területére specializálódott Web3. Élénk szemmel figyeli a feltörekvő trendeket és technológiákat, ezért átfogó tájékoztatást nyújt, hogy tájékoztassa és bevonja olvasóit a digitális pénzügyek folyamatosan fejlődő világába.



