Luma wprowadza na rynek Uni-1, swój pierwszy model łączący wnioskowanie i generowanie obrazu
W skrócie
Firma Luma zaprezentowała Uni-1, swój pierwszy model łączący wnioskowanie i generowanie obrazu w ramach jednej architektury — co stanowi znaczącą zmianę w stosunku do początków działalności startupu skupionego na wideo.
Startup zajmujący się generowaniem wideo za pomocą sztucznej inteligencji Luma wprowadziła na rynek Uni-1, swój pierwszy model integrujący wnioskowanie i generowanie obrazu w ramach jednej architektury, co oznaczało strategiczną zmianę w stosunku do wcześniejszego skupienia firmy na treściach wideo.
Według firmy, w ciągu ostatnich trzech lat prace Lumy ewoluowały od rekonstrukcji scen do generowania 3D i skalowania dystrybucji wideo, ale same media wizualne mają ograniczenia bez zintegrowanego rozumienia. Uni-1 jest pozycjonowany jako pierwszy zunifikowany model firmy, zaprojektowany w celu połączenia rozumowania i możliwości generatywnych, mający na celu rozwój multimodalnej inteligencji ogólnej.
Luma opisuje inteligencję ogólną jako zdolność do rozumowania, wyobrażania sobie, manipulowania symbolami i symulowania otoczenia. Chociaż istniejące systemy sztucznej inteligencji mogą wykonywać te funkcje niezależnie, Uni-1 dąży do ich połączenia w ramach jednego frameworka, modelując czas, przestrzeń i logikę, aby umożliwić rozwiązywanie problemów, których nie są w stanie osiągnąć tradycyjne, segmentowane procesy.
Model został zbudowany jako autoregresyjny transformator z samym dekoderem, reprezentujący tekst i obrazy w pojedynczej, przeplatanej sekwencji, która pełni funkcję zarówno wejścia, jak i wyjścia. Uni-1 jest w stanie przeprowadzać strukturalne rozumowanie wewnętrzne, rozbijać instrukcje, rozwiązywać ograniczenia, planować kompozycję i odpowiednio renderować obrazy.
Uni-1 demonstruje zdolność do „myślenia językiem oraz wyobrażania sobie i renderowania w pikselach”, co Luma określa mianem „inteligencji w pikselach”. W kolejnych wersjach spodziewane są dodatkowe funkcje, w tym generowanie dźwięku i obrazu. Model ten ma być nie tylko narzędziem, ale także platformą, która zmienia sposób działania firm poprzez integrację rozumowania bezpośrednio z kreatywnymi procesami pracy.
Agenci Luma rozszerzają ujednoliconą inteligencję
Bazując na platformie Uni-1, Luma wprowadziła niedawno na rynek Luma Agents – pakiet narzędzi opartych na sztucznej inteligencji, zaprojektowanych do kompleksowej produkcji kreatywnej obejmującej tekst, obrazy, wideo i audio. Agenci działają w oparciu o rodzinę modeli Unified Intelligence firmy Luma, które są trenowane w ramach jednego multimodalnego systemu wnioskowania. Luma pozycjonuje agentów jako rozwiązanie dla agencji reklamowych, zespołów marketingowych, studiów projektowych i klientów korporacyjnych, oferując skoordynowane generowanie kreacji w wielu modalnościach.
Agenci Luma są kompatybilni z innymi modelami sztucznej inteligencji, takimi jak Luma Ray 3.14, Google Veo 3 i Nano Banana Pro, ByteDance Seedream oraz narzędziami do generowania głosu ElevenLabs. Według Amita Jaina, prezesa i współzałożyciela Luma, agenci wykorzystują zintegrowaną architekturę Uni-1, która została wyszkolona w zakresie dźwięku, wideo, obrazu, języka i rozumowania przestrzennego, umożliwiając im planowanie, wykonywanie i generowanie treści w skoordynowanym, inteligentnym procesie.
Zastrzeżenie
Zgodnie z Zaufaj wytycznym projektu, należy pamiętać, że informacje zawarte na tej stronie nie mają na celu i nie powinny być interpretowane jako porady prawne, podatkowe, inwestycyjne, finansowe lub jakiekolwiek inne formy porad. Ważne jest, aby inwestować tylko tyle, na utratę czego możesz sobie pozwolić, a w przypadku jakichkolwiek wątpliwości zasięgnąć niezależnej porady finansowej. Aby uzyskać więcej informacji, sugerujemy zapoznać się z warunkami oraz stronami pomocy i wsparcia udostępnianymi przez wydawcę lub reklamodawcę. MetaversePost zobowiązuje się do sporządzania dokładnych i bezstronnych raportów, jednakże warunki rynkowe mogą ulec zmianie bez powiadomienia.
O autorze
Alisa, oddana dziennikarka w MPost, specjalizuje się w kryptowalutach, sztucznej inteligencji, inwestycjach i rozległym obszarze Web3. Ze szczególnym uwzględnieniem pojawiających się trendów i technologii zapewnia wszechstronne informacje, aby informować czytelników i angażować ich w stale zmieniający się krajobraz finansów cyfrowych.
Więcej artykułów
Alisa, oddana dziennikarka w MPost, specjalizuje się w kryptowalutach, sztucznej inteligencji, inwestycjach i rozległym obszarze Web3. Ze szczególnym uwzględnieniem pojawiających się trendów i technologii zapewnia wszechstronne informacje, aby informować czytelników i angażować ich w stale zmieniający się krajobraz finansów cyfrowych.



