„Luma“ pristato „Uni-1“ – pirmąjį modelį, integruojantį samprotavimus ir vaizdų generavimą.
Trumpai
„Luma“ pristatė „Uni-1“ – savo pirmąjį modelį, kuris vienoje architektūroje sujungia samprotavimus ir vaizdų generavimą – tai didelis pokytis nuo vaizdo įrašais orientuoto startuolio šaknų.
Dirbtinio intelekto vaizdo įrašų generavimo startuolis Luma pristatė „Uni-1“ – pirmąjį modelį, kuris integruoja samprotavimus ir vaizdų generavimą vienoje architektūroje, taip žymėdamas strateginį poslinkį nuo ankstesnio bendrovės dėmesio vaizdo turiniui.
Pasak bendrovės, per pastaruosius trejus metus „Luma“ darbas išsivystė nuo scenų rekonstrukcijos iki 3D generavimo ir vaizdo sklaidos mastelio keitimo, tačiau vien vizualinė medija turi apribojimų be integruoto supratimo. „Uni-1“ pozicionuojamas kaip pirmasis bendrovės vieningas modelis, skirtas sujungti samprotavimo ir generatyvinius gebėjimus, siekiant skatinti daugiamodalinį bendrąjį intelektą.
Luma bendrąjį intelektą apibūdina kaip gebėjimą samprotauti, įsivaizduoti, manipuliuoti simboliais ir imituoti aplinką. Nors esamos dirbtinio intelekto sistemos gali atlikti šias funkcijas atskirai, „Uni-1“ siekia jas sujungti į vieną sistemą, kartu modeliuodama laiką, erdvę ir logiką, kad būtų galima spręsti problemas, kurių negali pasiekti tradiciniai, segmentuoti kanalai.
Modelis sukurtas kaip tik dekoderio autoregresyvus transformatorius, vaizduojantis tekstą ir vaizdus vienoje susipynusiame sekoje, kuri veikia kaip įvestis ir išvestis. „Uni-1“ gali atlikti struktūrizuotą vidinį samprotavimą, suskirstyti instrukcijas, spręsti apribojimus, planuoti kompoziciją ir atitinkamai perteikti vaizdus.
„Uni-1“ demonstruoja gebėjimą „mąstyti kalba, įsivaizduoti ir atvaizduoti pikseliais“ – tai „Luma“ apibūdinama kaip „intelektas pikseliais“. Tikimasi, kad vėlesnėse versijose bus pridėta papildomų rezultatų, įskaitant garso ir vaizdo generavimą. Modelis skirtas ne tik kaip įrankis, bet ir kaip platforma, kuri transformuoja verslo veiklą, tiesiogiai integruodama samprotavimus į kūrybinius darbo procesus.
„Luma“ agentai išplečia vieningą intelektą
Remdamasi „Uni-1“ platforma, „Luma“ neseniai pristatė „Luma Agents“ – dirbtiniu intelektu pagrįstų įrankių rinkinį, skirtą visapusiškam kūrybiniam darbui teksto, vaizdų, vaizdo įrašų ir garso srityse. Agentai veikia naudodami „Luma Unified Intelligence“ modelių šeimą, kuri yra apmokyta vienoje multimodaline samprotavimo sistemoje. „Luma“ šiuos agentus pozicionuoja kaip sprendimą reklamos agentūroms, rinkodaros komandoms, dizaino studijoms ir verslo klientams, siūlydama koordinuotą kūrybinį generavimą įvairiais būdais.
„Luma“ agentai suderinami su kitais dirbtinio intelekto modeliais, įskaitant „Luma“ „Ray 3.14“, „Google“ „Veo 3“ ir „Nano Banana Pro“, „ByteDance“ „Seedream“ ir „ElevenLabs“ balso generavimo įrankius. Pasak „Luma“ generalinio direktoriaus ir bendraįkūrėjo Amito Jaino, agentai naudoja integruotą „Uni-1“ architektūrą, kuri buvo apmokyta garso, vaizdo, vaizdų, kalbos ir erdvinio mąstymo srityse, todėl jie gali planuoti, vykdyti ir generuoti turinį koordinuotame, intelektualiame darbo eigoje.
Atsakomybės neigimas
Remdamasi tuo, Pasitikėjimo projekto gairės, atkreipkite dėmesį, kad šiame puslapyje pateikta informacija nėra skirta ir neturėtų būti aiškinama kaip teisinė, mokesčių, investicinė, finansinė ar bet kokia kita konsultacija. Svarbu investuoti tik tai, ką galite sau leisti prarasti, ir, jei turite kokių nors abejonių, kreiptis į nepriklausomą finansinę konsultaciją. Norėdami gauti daugiau informacijos, siūlome peržiūrėti taisykles ir nuostatas bei pagalbos ir palaikymo puslapius, kuriuos pateikia išdavėjas arba reklamuotojas. MetaversePost yra įsipareigojusi teikti tikslias, nešališkas ataskaitas, tačiau rinkos sąlygos gali keistis be įspėjimo.
Apie autorių
Alisa, atsidavusi žurnalistė MPost, specializuojasi kriptovaliutų, dirbtinio intelekto, investicijų ir plačios srities srityse Web3. Akylai žvelgdama į naujas tendencijas ir technologijas, ji pateikia išsamią informaciją, kad informuotų ir įtrauktų skaitytojus į nuolat besikeičiančią skaitmeninių finansų aplinką.
Daugiau straipsnių
Alisa, atsidavusi žurnalistė MPost, specializuojasi kriptovaliutų, dirbtinio intelekto, investicijų ir plačios srities srityse Web3. Akylai žvelgdama į naujas tendencijas ir technologijas, ji pateikia išsamią informaciją, kad informuotų ir įtrauktų skaitytojus į nuolat besikeičiančią skaitmeninių finansų aplinką.



