گزارش خبری پیشرفته
مارس 22، 2023

Text-to-Video Model Gen-2 می تواند ویدیوهای کوتاه را با استفاده از پیام های متنی تولید کند

به طور خلاصه

مدل جدید Text2Video Gen-2 از RunWayML نه تنها می تواند موجود را ویرایش کند فیلم های بلکه موارد جدید را از ابتدا و تنها با استفاده از یک پیام متنی تولید کنید.

انتظار می‌رود این ویژگی نحوه ایجاد و اشتراک‌گذاری محتوا در پلتفرم‌های رسانه‌های اجتماعی را بهبود بخشد و به کاربران امکان تغییر شکل دهد تصاویر استاتیک به پویا و کلیپ های ویدیویی جذاب بدون هیچ دانش قبلی از ویرایش ویدیو.

مدل جدید تبدیل متن به ویدیو Gen-2 از Runway نه تنها می‌تواند ویدیوهای موجود را ویرایش کند، بلکه می‌تواند ویدیوهای جدیدی را از ابتدا تولید کند، تنها با استفاده از یک پیام متنی. این یک پیشرفت قابل توجه نسبت به نسخه قبلی Gen است که فقط می توانست ویدیوهای موجود را ویرایش کند. مدل تبدیل متن به ویدیو Gen-2 از فناوری پیشرفته هوش مصنوعی Runway برای ایجاد ویدیوهایی غیرقابل تشخیص از فیلم های ساخته شده توسط انسان استفاده می کند. با استفاده از این ویژگی جدید، کاربران می توانند با تولید خودکار ویدیوها بدون نیاز به مهارت های گسترده ویرایش ویدیو، در زمان و تلاش خود صرفه جویی کنند.

Text-to-Video Model Gen-2 می تواند ویدیوهای کوتاه را با استفاده از پیام های متنی تولید کند

مدل جدید Gen-2 همچنین قادر است یک تصویر آپلود شده را به تصویر تبدیل کند ویدئو کوتاه کلیپ این کار با ارائه یک راهنمایی متنی که کاربر می‌خواهد ویدیو را توصیف کند، انجام می‌شود. تا کنون، مدت زمان ویدیوها از چند ثانیه تجاوز نمی کند، اما کیفیت در حال حاضر بسیار بالاتر از رقبا است (مخصوصاً که رقبا شبکه های عصبی در دسترس عموم نیستند). انتظار می رود این ویژگی نحوه ایجاد و اشتراک گذاری محتوا در پلتفرم های رسانه های اجتماعی را بهبود بخشد. با مدل Gen-2، کاربران به راحتی می توانند تصاویر استاتیک خود را به کلیپ های ویدئویی پویا تبدیل کنند. شانس زیادی وجود دارد که فیس بوک یا Tiktok از این فناوری برای گسترش مجموعه ابزارهای هوش مصنوعی در دسترس سازندگان محتوا استفاده کنند.

مسابقه ویدئویی هوش مصنوعی وحشی است. فقط یک هفته از راه اندازی Gen-1 می گذرد و Gen-2 در حال حاضر منتشر شده است. رقابت بین شرکت‌های فناوری برای توسعه پیشرفته‌ترین فناوری ویدیوی هوش مصنوعی به سرعت در حال افزایش است و هر شرکتی در تلاش برای پیشی گرفتن از دیگری است.

برای امتحان نسخه جدید Gen، باید در صف ثبت نام کنید وب سایت باند.

  • Runway، یک استارتاپ هوش مصنوعی، Gen-1 را اعلام کرد، یک شبکه عصبی که می تواند ویدیوهای قدیمی را با ترکیب دستورات و تصاویر به ویدیوهای جدید تبدیل کند. Gen-1 فیلمسازان را قادر می سازد تا با استفاده از ترکیب بندی و سبک یک محتوا، به سرعت محتوا را به شیوه ای مقرون به صرفه تولید کنند. درخواست تصویر یا متن به ساختار ویدئوی منبع. Runway Research به ساخت سیستم‌های هوش مصنوعی چندوجهی اختصاص دارد که اشکال جدیدی از خلاقیت را امکان‌پذیر می‌سازد و Gen-1 می‌تواند برای آزمایش آینده داستان‌سرایی استفاده شود.
  • ماه گذشته، سام آلتمن، یکی از بنیانگذاران و مدیر عامل شرکت OpenAI، اخیراً با TechCrunch صحبت کرد و گفت OpenAI در حال توسعه است مدل هوش مصنوعی برای ویدیوها و GPT-4، که پس از تایید اعتماد و امنیت شرکت در دسترس عموم قرار خواهد گرفت.
  • در ماه اکتبر، گوگل Imagen Video را توسعه داد، روشی برای ایجاد ویدئوهای متنی مشروط بر اساس یک سری ویدئو مدل های انتشار. این سیستم توضیحات متنی را می پذیرد و یک فیلم 16 فریمی با سرعت سه فریم در ثانیه با وضوح 24 در 48 پیکسل تولید می کند. این سیستم فریم‌های اضافی را مقیاس‌بندی کرده و «پیش‌بینی» می‌کند و یک ویدیوی نهایی با ۱۲۸ فریم با سرعت ۲۴ فریم در ثانیه و وضوح ۷۲۰p (۱۲۸۰×۷۶۸) ایجاد می‌کند. 128 میلیون جفت تصویر-متن و 24 میلیون جفت ویدیو-متن برای آموزش Imagen Video استفاده شد.

مقالات مرتبط بیشتر را بخوانید:

سلب مسئولیت

در خط با دستورالعمل های پروژه اعتماد، لطفاً توجه داشته باشید که اطلاعات ارائه شده در این صفحه به عنوان مشاوره حقوقی، مالیاتی، سرمایه گذاری، مالی یا هر شکل دیگری در نظر گرفته نشده است و نباید تفسیر شود. مهم است که فقط در موردی سرمایه گذاری کنید که توانایی از دست دادن آن را دارید و در صورت شک و تردید به دنبال مشاوره مالی مستقل باشید. برای کسب اطلاعات بیشتر، پیشنهاد می کنیم به شرایط و ضوابط و همچنین صفحات راهنمایی و پشتیبانی ارائه شده توسط صادرکننده یا تبلیغ کننده مراجعه کنید. MetaversePost متعهد به گزارش دقیق و بی طرفانه است، اما شرایط بازار بدون اطلاع قبلی ممکن است تغییر کند.

درباره نویسنده

Damir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است. 

مقالات بیشتر
دامیر یالالوف
دامیر یالالوف

Damir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است. 

Hot Stories
به خبرنامه ما بپیوندید.
آخرین اخبار

از Ripple تا The Big Green DAO: چگونه پروژه های ارزهای دیجیتال به خیریه کمک می کنند

بیایید طرح‌هایی را بررسی کنیم که از پتانسیل ارزهای دیجیتال برای اهداف خیریه استفاده می‌کنند.

بیشتر بدانید

AlphaFold 3، Med-Gemini، و دیگران: روشی که هوش مصنوعی مراقبت های بهداشتی را در سال 2024 متحول می کند

هوش مصنوعی به روش های مختلفی در مراقبت های بهداشتی ظاهر می شود، از کشف همبستگی های ژنتیکی جدید تا توانمندسازی سیستم های جراحی رباتیک...

بیشتر بدانید
به انجمن فناوری نوآورانه ما بپیوندید
ادامه مطلب
ادامه مطلب
10 ابزار رایگان هوش مصنوعی برای ایجاد محتوا، ویرایش ویدیو و موارد دیگر
AI Wiki هضم آموزش شیوه زندگی نرم افزار پیشرفته
10 ابزار رایگان هوش مصنوعی برای ایجاد محتوا، ویرایش ویدیو و موارد دیگر
ممکن است 14، 2024
هشدار کمیسیون اوراق بهادار هنگ کنگ در مورد کلاهبرداری های Deepfake که صنعت کریپتو را هدف قرار می دهد: پیامدهایی برای ایمنی سرمایه گذاران
شیوه زندگی دوربین های مداربسته Wiki نرم افزار داستان ها و نقدها پیشرفته
هشدار کمیسیون اوراق بهادار هنگ کنگ در مورد کلاهبرداری های Deepfake که صنعت کریپتو را هدف قرار می دهد: پیامدهایی برای ایمنی سرمایه گذاران
ممکن است 14، 2024
همکاری Ripple و Evmos در توسعه زنجیره جانبی XRP Ledger EVM با فناوری EvmOS
کسب و کار گزارش خبری پیشرفته
همکاری Ripple و Evmos در توسعه زنجیره جانبی XRP Ledger EVM با فناوری EvmOS
ممکن است 14، 2024
5ireChain "Testnet Thunder: GA" را برای تست استرس شبکه راه اندازی می کند و از کاربران دعوت می کند تا در آن شرکت کنند. Airdrop پاداش
گزارش خبری پیشرفته
5ireChain "Testnet Thunder: GA" را برای تست استرس شبکه راه اندازی می کند و از کاربران دعوت می کند تا در آن شرکت کنند. Airdrop پاداش
ممکن است 14، 2024
CRYPTOMERIA LABS PTE. محدود