لوما Uni-1، اولین مدل خود که استدلال و تولید تصویر را ادغام میکند، عرضه میکند
به طور خلاصه
لوما از Uni-1، اولین مدل خود که استدلال و تولید تصویر را در یک معماری ترکیب میکند، رونمایی کرد - که یک تغییر اساسی نسبت به ریشههای این استارتاپ متمرکز بر ویدیو است.
استارتاپ تولید ویدئو با هوش مصنوعی لوما Uni-1 را معرفی کرد، اولین مدلی که استدلال و تولید تصویر را در یک معماری واحد ادغام میکند و نشاندهندهی یک تغییر استراتژیک از تمرکز قبلی شرکت بر محتوای ویدیویی است.
طبق گفته این شرکت، طی سه سال گذشته، کار لوما از بازسازی صحنه به تولید سهبعدی و مقیاسبندی انتشار ویدیو تکامل یافته است، اما رسانههای بصری به تنهایی و بدون درک یکپارچه محدودیتهایی دارند. Uni-1 به عنوان اولین مدل یکپارچه این شرکت که برای ترکیب قابلیتهای استدلال و تولید طراحی شده است، با هدف پیشبرد هوش عمومی چندوجهی قرار گرفته است.
لوما هوش عمومی را به عنوان توانایی استدلال، تخیل، دستکاری نمادها و شبیهسازی محیطها توصیف میکند. در حالی که سیستمهای هوش مصنوعی موجود میتوانند این عملکردها را به طور جداگانه انجام دهند، Uni-1 به دنبال ترکیب آنها در یک چارچوب واحد است و زمان، فضا و منطق را با هم مدلسازی میکند تا حل مسئلهای را که خطوط لوله سنتی و قطعهبندی شده نمیتوانند به آن دست یابند، امکانپذیر سازد.
این مدل به عنوان یک مبدل خودهمبستهی فقط رمزگشا ساخته شده است که متن و تصاویر را در یک توالی درهمتنیده واحد که هم به عنوان ورودی و هم به عنوان خروجی عمل میکند، نمایش میدهد. Uni-1 قادر به انجام استدلال داخلی ساختاریافته، تجزیه دستورالعملها، حل محدودیتها، برنامهریزی ترکیب و رندر تصاویر بر اساس آن است.
Uni-1 توانایی «فکر کردن به زبان و تصور و رندر کردن در پیکسلها» را نشان میدهد، قابلیتی که لوما آن را «هوش در پیکسلها» توصیف میکند. انتظار میرود خروجیهای اضافی، از جمله تولید صدا و تصویر، در نسخههای بعدی ارائه شوند. این مدل نه تنها به عنوان یک ابزار، بلکه به عنوان بستری در نظر گرفته شده است که با ادغام مستقیم استدلال در گردشهای کاری خلاقانه، نحوه عملکرد مشاغل را متحول میکند.
مأموران لوما، اطلاعات یکپارچه را گسترش میدهند
لوما با تکیه بر Uni-1، اخیراً Luma Agents را راهاندازی کرده است، مجموعهای از ابزارهای مبتنی بر هوش مصنوعی که برای مدیریت تولید خلاقانه سرتاسری در متن، تصویر، ویدیو و صدا طراحی شدهاند. این Agentها با استفاده از خانواده مدلهای Unified Intelligence لوما کار میکنند که بر اساس یک سیستم استدلال چندوجهی واحد آموزش دیدهاند. لوما این Agentها را به عنوان راهکاری برای آژانسهای تبلیغاتی، تیمهای بازاریابی، استودیوهای طراحی و مشتریان سازمانی قرار میدهد و تولید خلاقانه هماهنگ را در چندین روش ارائه میدهد.
عاملهای لوما با سایر مدلهای هوش مصنوعی، از جمله Ray 3.14 لوما، Veo 3 و Nano Banana Pro گوگل، Seedream بایتدنس و ابزارهای تولید صدای ElevenLabs سازگار هستند. به گفته آمیت جین، مدیرعامل و یکی از بنیانگذاران لوما، این عاملها از معماری یکپارچه Uni-1 بهره میبرند که در زمینههای صدا، ویدئو، تصویر، زبان و استدلال فضایی آموزش دیده است و به آنها امکان برنامهریزی، اجرا و تولید محتوا را در یک گردش کار هماهنگ و هوشمند میدهد.
رفع مسئولیت
در خط با دستورالعمل های پروژه اعتماد، لطفاً توجه داشته باشید که اطلاعات ارائه شده در این صفحه به عنوان مشاوره حقوقی، مالیاتی، سرمایه گذاری، مالی یا هر شکل دیگری در نظر گرفته نشده است و نباید تفسیر شود. مهم است که فقط در موردی سرمایه گذاری کنید که توانایی از دست دادن آن را دارید و در صورت شک و تردید به دنبال مشاوره مالی مستقل باشید. برای کسب اطلاعات بیشتر، پیشنهاد می کنیم به شرایط و ضوابط و همچنین صفحات راهنمایی و پشتیبانی ارائه شده توسط صادرکننده یا تبلیغ کننده مراجعه کنید. MetaversePost متعهد به گزارش دقیق و بی طرفانه است، اما شرایط بازار بدون اطلاع قبلی ممکن است تغییر کند.
درباره نویسنده
آلیسا، یک روزنامه نگار اختصاصی در MPost، متخصص در ارزهای دیجیتال، هوش مصنوعی، سرمایهگذاری و حوزه گسترده... Web3. او با نگاهی دقیق به روندها و فناوریهای نوظهور، پوشش جامعی را برای اطلاعرسانی و مشارکت خوانندگان در چشمانداز همیشه در حال تحول مالی دیجیتال ارائه میکند.
مقالات بیشتر
آلیسا، یک روزنامه نگار اختصاصی در MPost، متخصص در ارزهای دیجیتال، هوش مصنوعی، سرمایهگذاری و حوزه گسترده... Web3. او با نگاهی دقیق به روندها و فناوریهای نوظهور، پوشش جامعی را برای اطلاعرسانی و مشارکت خوانندگان در چشمانداز همیشه در حال تحول مالی دیجیتال ارائه میکند.



