Text-to-Video Model Gen-2 می تواند ویدیوهای کوتاه را با استفاده از پیام های متنی تولید کند
به طور خلاصه
مدل جدید Text2Video Gen-2 از RunWayML نه تنها می تواند موجود را ویرایش کند فیلم های بلکه موارد جدید را از ابتدا و تنها با استفاده از یک پیام متنی تولید کنید.
انتظار میرود این ویژگی نحوه ایجاد و اشتراکگذاری محتوا در پلتفرمهای رسانههای اجتماعی را بهبود بخشد و به کاربران امکان تغییر شکل دهد تصاویر استاتیک به پویا و کلیپ های ویدیویی جذاب بدون هیچ دانش قبلی از ویرایش ویدیو.
مدل جدید تبدیل متن به ویدیو Gen-2 از Runway نه تنها میتواند ویدیوهای موجود را ویرایش کند، بلکه میتواند ویدیوهای جدیدی را از ابتدا تولید کند، تنها با استفاده از یک پیام متنی. این یک پیشرفت قابل توجه نسبت به نسخه قبلی Gen است که فقط می توانست ویدیوهای موجود را ویرایش کند. مدل تبدیل متن به ویدیو Gen-2 از فناوری پیشرفته هوش مصنوعی Runway برای ایجاد ویدیوهایی غیرقابل تشخیص از فیلم های ساخته شده توسط انسان استفاده می کند. با استفاده از این ویژگی جدید، کاربران می توانند با تولید خودکار ویدیوها بدون نیاز به مهارت های گسترده ویرایش ویدیو، در زمان و تلاش خود صرفه جویی کنند.
مدل جدید Gen-2 همچنین قادر است یک تصویر آپلود شده را به تصویر تبدیل کند ویدئو کوتاه کلیپ این کار با ارائه یک راهنمایی متنی که کاربر میخواهد ویدیو را توصیف کند، انجام میشود. تا کنون، مدت زمان ویدیوها از چند ثانیه تجاوز نمی کند، اما کیفیت در حال حاضر بسیار بالاتر از رقبا است (مخصوصاً که رقبا شبکه های عصبی در دسترس عموم نیستند). انتظار می رود این ویژگی نحوه ایجاد و اشتراک گذاری محتوا در پلتفرم های رسانه های اجتماعی را بهبود بخشد. با مدل Gen-2، کاربران به راحتی می توانند تصاویر استاتیک خود را به کلیپ های ویدئویی پویا تبدیل کنند. شانس زیادی وجود دارد که فیس بوک یا Tiktok از این فناوری برای گسترش مجموعه ابزارهای هوش مصنوعی در دسترس سازندگان محتوا استفاده کنند.
مسابقه ویدئویی هوش مصنوعی وحشی است. فقط یک هفته از راه اندازی Gen-1 می گذرد و Gen-2 در حال حاضر منتشر شده است. رقابت بین شرکتهای فناوری برای توسعه پیشرفتهترین فناوری ویدیوی هوش مصنوعی به سرعت در حال افزایش است و هر شرکتی در تلاش برای پیشی گرفتن از دیگری است.
برای امتحان نسخه جدید Gen، باید در صف ثبت نام کنید وب سایت باند.
- Runway، یک استارتاپ هوش مصنوعی، Gen-1 را اعلام کرد، یک شبکه عصبی که می تواند ویدیوهای قدیمی را با ترکیب دستورات و تصاویر به ویدیوهای جدید تبدیل کند. Gen-1 فیلمسازان را قادر می سازد تا با استفاده از ترکیب بندی و سبک یک محتوا، به سرعت محتوا را به شیوه ای مقرون به صرفه تولید کنند. درخواست تصویر یا متن به ساختار ویدئوی منبع. Runway Research به ساخت سیستمهای هوش مصنوعی چندوجهی اختصاص دارد که اشکال جدیدی از خلاقیت را امکانپذیر میسازد و Gen-1 میتواند برای آزمایش آینده داستانسرایی استفاده شود.
- ماه گذشته، سام آلتمن، یکی از بنیانگذاران و مدیر عامل شرکت OpenAI، اخیراً با TechCrunch صحبت کرد و گفت OpenAI در حال توسعه است مدل هوش مصنوعی برای ویدیوها و GPT-4، که پس از تایید اعتماد و امنیت شرکت در دسترس عموم قرار خواهد گرفت.
- در ماه اکتبر، گوگل Imagen Video را توسعه داد، روشی برای ایجاد ویدئوهای متنی مشروط بر اساس یک سری ویدئو مدل های انتشار. این سیستم توضیحات متنی را می پذیرد و یک فیلم 16 فریمی با سرعت سه فریم در ثانیه با وضوح 24 در 48 پیکسل تولید می کند. این سیستم فریمهای اضافی را مقیاسبندی کرده و «پیشبینی» میکند و یک ویدیوی نهایی با ۱۲۸ فریم با سرعت ۲۴ فریم در ثانیه و وضوح ۷۲۰p (۱۲۸۰×۷۶۸) ایجاد میکند. 128 میلیون جفت تصویر-متن و 24 میلیون جفت ویدیو-متن برای آموزش Imagen Video استفاده شد.
مقالات مرتبط بیشتر را بخوانید:
سلب مسئولیت
در خط با دستورالعمل های پروژه اعتماد، لطفاً توجه داشته باشید که اطلاعات ارائه شده در این صفحه به عنوان مشاوره حقوقی، مالیاتی، سرمایه گذاری، مالی یا هر شکل دیگری در نظر گرفته نشده است و نباید تفسیر شود. مهم است که فقط در موردی سرمایه گذاری کنید که توانایی از دست دادن آن را دارید و در صورت شک و تردید به دنبال مشاوره مالی مستقل باشید. برای کسب اطلاعات بیشتر، پیشنهاد می کنیم به شرایط و ضوابط و همچنین صفحات راهنمایی و پشتیبانی ارائه شده توسط صادرکننده یا تبلیغ کننده مراجعه کنید. MetaversePost متعهد به گزارش دقیق و بی طرفانه است، اما شرایط بازار بدون اطلاع قبلی ممکن است تغییر کند.
درباره نویسنده
Damir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است.
مقالات بیشترDamir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است.