تقرير الأخبار
06 أكتوبر 2022

تتغلب Google على Meta من خلال إطلاق مولد AI جديد لتحويل النص إلى فيديو ، وهو Imagen Video 

في سطور

يحاول Imagen Video من Google مساعدة منشئ الفيديو في التحول إلى تطبيقات قاتلة

لم يستغرق Google وقتًا طويلاً للرد على Make-a-Video من Meta. باستخدام موجه نص ، فيديو Imagen قد تنتج فيديو رائع. النتائج تقدم هائل فوق حالة الفن على الرغم من عدد من العيوب.

بالمقارنة مع مُنشئ Facebook Text-to-Video AI اصنع مقطع فيديوكانت النتائج أفضل بشكل ملحوظ. ومع ذلك ، تتطلب هذه الاستراتيجية أيضًا مزيدًا من الرقابة. على عكس Imagen Video ، حيث عمل العاملون الصغار بجد لتعليق الأفلام بأوصاف مكتوبة ، استخدم Make-a-Scene مقاطع فيديو غير مصنفة للتدريب.

إن الخوض في تفاصيل الهندسة المعمارية لا طائل من ورائه. يجب أن تقرأ عنها في المقال هنا. يمكننا فقط التأكيد على أنه تم إنشاء 16 إطارًا أولاً من تضمين النص لجهاز تشفير T5 بدقة 48 × 24 مع 3 إطارات في الثانية ، وأنه يتم ترقية هذا بعد ذلك من خلال عدد من نماذج الانتشار في الفيلم النهائي من 128 إطارًا عند 1280 × 768 و 24 إطارًا في الثانية.

ما هو فيديو Imagen؟

Imagen Video هي طريقة لإنشاء مقاطع فيديو نصية مشروطة بناءً على سلسلة من نماذج نشر الفيديو. تنتج شركة Imagen Video أفلامًا عالية الجودة من المطالبات النصية من خلال الجمع بين نموذج إنتاج الفيديو الأساسي وسلسلة من نماذج الفيديو فائقة الدقة المكانية والزمانية. قم بمراجعة اختيارات التصميم التي قام بها الفريق أثناء توسيع نطاق النظام كنظام عالي المستوىdefiنموذج جديد لتحويل النص إلى فيديو ، بما في ذلك قرار تحديد معايير v لنماذج الانتشار واختيار نماذج الدقة الفائقة التلافيفية الكاملة الزمانية والمكانية بدقة محددة. بالإضافة إلى ذلك ، فإنه يتحقق من صحة النتائج من العمل السابق على إنتاج الصور المستند إلى الانتشار وتطبيقها على سياق توليد الفيديو. تخضع نماذج الفيديو بعد ذلك للتقطير التدريجي مع إرشادات خالية من المصنف لأخذ عينات سريعة وعالية الجودة.

يدعي فريق بحث Google أن النظام يقبل وصفًا نصيًا و يولد فيلمًا من 16 إطارًا بمعدل ثلاثة إطارات في الثانية بدقة 24 × 48 بكسل. يقوم النظام بقياس الإطارات الإضافية و "توقعها" ، مما يؤدي إلى إنشاء فيديو نهائي بـ 128 إطارًا بمعدل 24 إطارًا في الثانية ودقة 720 بكسل (1280 × 768). هناك 60 مليون زوج من الصور والنصوص و 14 مليون من أزواج نصوص الفيديو تم استخدامها لتدريب Imagen Video.

عينات فيديو Imagen

حتى لو كان مجرد استخدام الذكاء الاصطناعي لصنع الفيديو أسرع وأقل تكلفة ، فإن هذه التقنيات ستُستخدم بلا شك في كل مكان.

مهتم بقراءة المزيد؟ فيما يلي بعض الموضوعات الإضافية التي يجب التحقق منها:

إخلاء المسئولية

تتماشى مع المبادئ التوجيهية لمشروع الثقةيرجى ملاحظة أن المعلومات المقدمة في هذه الصفحة ليس المقصود منها ولا ينبغي تفسيرها على أنها نصيحة قانونية أو ضريبية أو استثمارية أو مالية أو أي شكل آخر من أشكال المشورة. من المهم أن تستثمر فقط ما يمكنك تحمل خسارته وأن تطلب مشورة مالية مستقلة إذا كانت لديك أي شكوك. لمزيد من المعلومات، نقترح الرجوع إلى الشروط والأحكام بالإضافة إلى صفحات المساعدة والدعم المقدمة من جهة الإصدار أو المعلن. MetaversePost تلتزم بتقارير دقيقة وغير متحيزة، ولكن ظروف السوق عرضة للتغيير دون إشعار.

نبذة عن الكاتب

دامير هو قائد الفريق ومدير المنتج والمحرر في Metaverse Post، تغطي موضوعات مثل AI / ML و AGI و LLMs و Metaverse و Web3-حقول ذات صله. تجذب مقالاته جمهورًا هائلاً يزيد عن مليون مستخدم كل شهر. يبدو أنه خبير يتمتع بخبرة 10 سنوات في تحسين محركات البحث والتسويق الرقمي. تم ذكر دامير في Mashable، Wired، Cointelegraphو The New Yorker و Inside.com و Entrepreneur و BeInCrypto ومنشورات أخرى. يسافر بين الإمارات العربية المتحدة وتركيا وروسيا ورابطة الدول المستقلة كبدو رقمي. حصل دامير على درجة البكالوريوس في الفيزياء ، والذي يعتقد أنه منحه مهارات التفكير النقدي اللازمة للنجاح في المشهد المتغير باستمرار للإنترنت. 

المزيد من المقالات
دامير يالالوف
دامير يالالوف

دامير هو قائد الفريق ومدير المنتج والمحرر في Metaverse Post، تغطي موضوعات مثل AI / ML و AGI و LLMs و Metaverse و Web3-حقول ذات صله. تجذب مقالاته جمهورًا هائلاً يزيد عن مليون مستخدم كل شهر. يبدو أنه خبير يتمتع بخبرة 10 سنوات في تحسين محركات البحث والتسويق الرقمي. تم ذكر دامير في Mashable، Wired، Cointelegraphو The New Yorker و Inside.com و Entrepreneur و BeInCrypto ومنشورات أخرى. يسافر بين الإمارات العربية المتحدة وتركيا وروسيا ورابطة الدول المستقلة كبدو رقمي. حصل دامير على درجة البكالوريوس في الفيزياء ، والذي يعتقد أنه منحه مهارات التفكير النقدي اللازمة للنجاح في المشهد المتغير باستمرار للإنترنت. 

Hot Stories
اشترك في صحيفتنا الإخبارية.
آخـر الأخبار

جنون DOGE: تحليل الارتفاع الأخير في قيمة Dogecoin (DOGE).

تتوسع صناعة العملات المشفرة بسرعة، وتستعد العملات الميمية لارتفاع كبير. دوجكوين (DOGE)، ...

أعرف المزيد

تطور المحتوى الناتج عن الذكاء الاصطناعي في Metaverse

يعد ظهور محتوى الذكاء الاصطناعي التوليدي أحد أكثر التطورات الرائعة داخل البيئة الافتراضية ...

أعرف المزيد
انضم إلى مجتمعنا التقني المبتكر
تفاصيل أكثر
المزيد
Scroll تكمل ترقية Bernoulli Mainnet، وتتوقع انخفاضًا بمقدار 10 أضعاف في تكاليف المعاملات
تقرير الأخبار تكنولوجيا
Scroll تكمل ترقية Bernoulli Mainnet، وتتوقع انخفاضًا بمقدار 10 أضعاف في تكاليف المعاملات
29 نيسان
يسرد OKX Jumpstart عملة Runecoin، ويتيح إمكانية تخزين BTC لكسب رموز RUNE
الأسواق تقرير الأخبار تكنولوجيا
يسرد OKX Jumpstart عملة Runecoin، ويتيح إمكانية تخزين BTC لكسب رموز RUNE
29 نيسان
أفضل الصفقات لهذا الأسبوع، والاستثمارات الكبرى في الذكاء الاصطناعي، وتكنولوجيا المعلومات، Web3و التشفير (22-26.04)
استوعب باقة الأعمال الأسواق تكنولوجيا
أفضل الصفقات لهذا الأسبوع، والاستثمارات الكبرى في الذكاء الاصطناعي، وتكنولوجيا المعلومات، Web3و التشفير (22-26.04)
26 نيسان
يعلق فيتاليك بوتيرين على مركزية إثبات العمل، ويشير إلى أنها كانت مرحلة مؤقتة حتى إثبات الحصة
تقرير الأخبار تكنولوجيا
يعلق فيتاليك بوتيرين على مركزية إثبات العمل، ويشير إلى أنها كانت مرحلة مؤقتة حتى إثبات الحصة
26 نيسان
CRYPTOMERIA LABS PTE. المحدودة.