Gen-1: AI با ترکیب دستورات و تصاویر ویدیوهای جدیدی را از ویدیوهای موجود تولید می کند
به طور خلاصه
Gen-1 یک شبکه عصبی است که می تواند ویدیوهای جدیدی را از ویدیوهای موجود با ترکیب ایجاد کند درخواست ها و تصاویر.
همچنین میتوان از آن برای ایجاد ویدیوهای کاملاً جدید از ابتدا استفاده کرد.
توانایی تولید ویدیوهای جدید از ویدیوهای موجود دارای تعدادی کاربرد بالقوه است.
RunWayML، یک استارتاپ هوش مصنوعی، اعلام کرده است یک محصول جدید به نام Gen-1، یک شبکه عصبی که میتواند با ترکیب پیامها و تصاویر ویدیوهای جدیدی را از ویدیوهای موجود تولید کند. سالهاست که شبکههای عصبی به وظیفه انتقال سبک، که فرآیند گرفتن یک تصویر و اعمال سبک یک تصویر دیگر روی آن است، محدود شدهاند. اینگونه است که ما آن ویدیوهای انتقال سبک یادگیری عمیق سه گانه را دریافت می کنیم که برای مثال، منظره ای به سبک شب پرستاره ون گوگ ارائه می شود.
اکنون، با Gen-1، شبکه های عصبی می توانند بیش از انتقال سبک انجام دهند. میتواند با استفاده از پیامها و تصاویر به عنوان ورودی، فیلمهای جدید را از ابتدا تولید کند. این یک طیف کاملاً جدید از امکانات را برای شما باز می کند ویدیوهای ایجاد شده توسط هوش مصنوعی. در حال حاضر، ویدئوهای تولید شده توسط Gen-1 کوتاه و ساده هستند. اما با توسعه فناوری، میتوان انتظار داشت که پیچیدهتر و پیچیدهتر را ببینیم ویدئوهای واقعی که توسط هوش مصنوعی تولید می شوند.
Gen-1 چیست؟
ابزارهای قوی ایجاد و ویرایش تصویر با هدایت متن باز می شوند مدل های انتشار مولد. در حالی که این روش ها برای ایجاد فیلم ها به کار گرفته شده اند، روش های فعلی برای ویرایش محتوای مطالب موجود در حالی که ساختار آن حفظ می شود، نیازمند آموزش مجدد گران قیمت برای هر ورودی است یا به انتشار مخاطره آمیز تغییرات تصویر بین فریم ها بستگی دارد.
توسعهدهندگان مدلی را برای انتشار ویدئوی هدایتشده از طریق ساختار و محتوا توصیف میکنند که فیلمها را بر اساس توضیحات نوشتاری یا بصری نتیجه مورد نظر تغییر میدهد. به دلیل جداسازی ناکافی، تضاد بین اصلاحات محتوای ارائه شده توسط کاربر و نمایش ساختار ایجاد می شود. آنها نشان می دهند که ساختار و یکپارچگی محتوا ممکن است با آموزش بر روی تخمین عمق تک چشمی با سطوح مختلف جزئیات کنترل شود.
با استفاده از ترکیب بندی و سبک یک تصویر یا پیام متنی در ساختار ویدیوی منبع خود، ویدیوهای جدید را به شیوه ای واقع بینانه و سازگار ترکیب کنید. مثل فیلمبرداری از یک چیز جدید بدون فیلمبرداری واقعی است.
انتقال سبک یک تصویر یا درخواست به هر فریم از یک ویدیو می تواند یک راه عالی برای یکپارچه سازی پروژه شما، دادن تم بصری فراگیر به آن و ایجاد یکپارچگی باشد.
با استفاده از نرمافزار و طراحی خلاقانه، ماکتها را میتوان به رندرهای زیبایی شناختی و تعاملی تبدیل کرد که دید کاربر را زنده میکند.
با ویژگیهای ویرایش ویدیو، جداسازی بخشهایی از ویدیو و بهبود آنها با اعلانهای متنی آسان است.
اعمال یک تصویر ورودی یا سریع رندرهای بدون بافت می توانند واقع گرایی آنها را تا حد زیادی بهبود بخشند و مدل های سه بعدی را زنده کنند.
Runway Research به ساخت سیستمهای هوش مصنوعی چندوجهی اختصاص دارد که اشکال جدیدی از خلاقیت را ممکن میسازد. Gen-1 نشان دهنده یکی دیگر از گام های اساسی ما در این ماموریت است. اگر خلاق هستید و به دنبال آزمایش با آینده داستان سرایی هستید، در زیر درخواست دسترسی کنید.
Gen-1 همچنین می تواند برای ایجاد ویدیوهای کاملاً جدید از ابتدا استفاده شود. میتوان از آن برای اهداف مختلفی استفاده کرد، از جمله ایجاد نسخههای جدید از فیلمهای موجود یا ساختن کلی فیلمهای جدید. این خبر مطمئناً فیلمسازان و دیگر خلاقانی را که همیشه به دنبال راههای جدیدی برای عبور از مرزهای هنر خود هستند هیجان زده میکند. با Gen-1، آنها اکنون یک ابزار قدرتمند جدید در اختیار دارند.
توانایی فیلم های جدید تولید کنید از موارد موجود تعدادی کاربرد بالقوه دارد. به عنوان مثال، میتوان از آن برای ایجاد نسخههای جدید محتوای ویدیویی موجود استفاده کرد، بنابراین میتوان از آن برای ایجاد نسخههای جایگزین از صحنهها یا نماهایی استفاده کرد که ممکن است فیلمبرداری بسیار گران یا از نظر لجستیکی دشوار باشد.
می توانید برای استفاده از مدل در حالی که در مرحله آزمایش بتا است درخواست دهید اینجا کلیک نمایید.
درباره هوش مصنوعی بیشتر بخوانید:
سلب مسئولیت
در خط با دستورالعمل های پروژه اعتماد، لطفاً توجه داشته باشید که اطلاعات ارائه شده در این صفحه به عنوان مشاوره حقوقی، مالیاتی، سرمایه گذاری، مالی یا هر شکل دیگری در نظر گرفته نشده است و نباید تفسیر شود. مهم است که فقط در موردی سرمایه گذاری کنید که توانایی از دست دادن آن را دارید و در صورت شک و تردید به دنبال مشاوره مالی مستقل باشید. برای کسب اطلاعات بیشتر، پیشنهاد می کنیم به شرایط و ضوابط و همچنین صفحات راهنمایی و پشتیبانی ارائه شده توسط صادرکننده یا تبلیغ کننده مراجعه کنید. MetaversePost متعهد به گزارش دقیق و بی طرفانه است، اما شرایط بازار بدون اطلاع قبلی ممکن است تغییر کند.
درباره نویسنده
Damir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است.
مقالات بیشترDamir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است.