تتغلب Google على Meta من خلال إطلاق مولد AI جديد لتحويل النص إلى فيديو ، وهو Imagen Video
في سطور
يحاول Imagen Video من Google مساعدة منشئ الفيديو في التحول إلى تطبيقات قاتلة
لم يستغرق Google وقتًا طويلاً للرد على Make-a-Video من Meta. باستخدام موجه نص ، فيديو Imagen قد تنتج فيديو رائع. النتائج تقدم هائل فوق حالة الفن على الرغم من عدد من العيوب.
بالمقارنة مع مُنشئ Facebook Text-to-Video AI اصنع مقطع فيديوكانت النتائج أفضل بشكل ملحوظ. ومع ذلك ، تتطلب هذه الاستراتيجية أيضًا مزيدًا من الرقابة. على عكس Imagen Video ، حيث عمل العاملون الصغار بجد لتعليق الأفلام بأوصاف مكتوبة ، استخدم Make-a-Scene مقاطع فيديو غير مصنفة للتدريب.
إن الخوض في تفاصيل الهندسة المعمارية لا طائل من ورائه. يجب أن تقرأ عنها في المقال هنا. يمكننا فقط التأكيد على أنه تم إنشاء 16 إطارًا أولاً من تضمين النص لجهاز تشفير T5 بدقة 48 × 24 مع 3 إطارات في الثانية ، وأنه يتم ترقية هذا بعد ذلك من خلال عدد من نماذج الانتشار في الفيلم النهائي من 128 إطارًا عند 1280 × 768 و 24 إطارًا في الثانية.
ما هو فيديو Imagen؟
Imagen Video هي طريقة لإنشاء مقاطع فيديو نصية مشروطة بناءً على سلسلة من نماذج نشر الفيديو. تنتج شركة Imagen Video أفلامًا عالية الجودة من المطالبات النصية من خلال الجمع بين نموذج إنتاج الفيديو الأساسي وسلسلة من نماذج الفيديو فائقة الدقة المكانية والزمانية. قم بمراجعة اختيارات التصميم التي قام بها الفريق أثناء توسيع نطاق النظام كنظام عالي المستوىdefiنموذج جديد لتحويل النص إلى فيديو ، بما في ذلك قرار تحديد معايير v لنماذج الانتشار واختيار نماذج الدقة الفائقة التلافيفية الكاملة الزمانية والمكانية بدقة محددة. بالإضافة إلى ذلك ، فإنه يتحقق من صحة النتائج من العمل السابق على إنتاج الصور المستند إلى الانتشار وتطبيقها على سياق توليد الفيديو. تخضع نماذج الفيديو بعد ذلك للتقطير التدريجي مع إرشادات خالية من المصنف لأخذ عينات سريعة وعالية الجودة.
يدعي فريق بحث Google أن النظام يقبل وصفًا نصيًا و يولد فيلمًا من 16 إطارًا بمعدل ثلاثة إطارات في الثانية بدقة 24 × 48 بكسل. يقوم النظام بقياس الإطارات الإضافية و "توقعها" ، مما يؤدي إلى إنشاء فيديو نهائي بـ 128 إطارًا بمعدل 24 إطارًا في الثانية ودقة 720 بكسل (1280 × 768). هناك 60 مليون زوج من الصور والنصوص و 14 مليون من أزواج نصوص الفيديو تم استخدامها لتدريب Imagen Video.
عينات فيديو Imagen
حتى لو كان مجرد استخدام الذكاء الاصطناعي لصنع الفيديو أسرع وأقل تكلفة ، فإن هذه التقنيات ستُستخدم بلا شك في كل مكان.
مهتم بقراءة المزيد؟ فيما يلي بعض الموضوعات الإضافية التي يجب التحقق منها:
إخلاء المسئولية
تتماشى مع المبادئ التوجيهية لمشروع الثقةيرجى ملاحظة أن المعلومات المقدمة في هذه الصفحة ليس المقصود منها ولا ينبغي تفسيرها على أنها نصيحة قانونية أو ضريبية أو استثمارية أو مالية أو أي شكل آخر من أشكال المشورة. من المهم أن تستثمر فقط ما يمكنك تحمل خسارته وأن تطلب مشورة مالية مستقلة إذا كانت لديك أي شكوك. لمزيد من المعلومات، نقترح الرجوع إلى الشروط والأحكام بالإضافة إلى صفحات المساعدة والدعم المقدمة من جهة الإصدار أو المعلن. MetaversePost تلتزم بتقارير دقيقة وغير متحيزة، ولكن ظروف السوق عرضة للتغيير دون إشعار.
نبذة عن الكاتب
دامير هو قائد الفريق ومدير المنتج والمحرر في Metaverse Post، تغطي موضوعات مثل AI / ML و AGI و LLMs و Metaverse و Web3-حقول ذات صله. تجذب مقالاته جمهورًا هائلاً يزيد عن مليون مستخدم كل شهر. يبدو أنه خبير يتمتع بخبرة 10 سنوات في تحسين محركات البحث والتسويق الرقمي. تم ذكر دامير في Mashable، Wired، Cointelegraphو The New Yorker و Inside.com و Entrepreneur و BeInCrypto ومنشورات أخرى. يسافر بين الإمارات العربية المتحدة وتركيا وروسيا ورابطة الدول المستقلة كبدو رقمي. حصل دامير على درجة البكالوريوس في الفيزياء ، والذي يعتقد أنه منحه مهارات التفكير النقدي اللازمة للنجاح في المشهد المتغير باستمرار للإنترنت.
المزيد من المقالاتدامير هو قائد الفريق ومدير المنتج والمحرر في Metaverse Post، تغطي موضوعات مثل AI / ML و AGI و LLMs و Metaverse و Web3-حقول ذات صله. تجذب مقالاته جمهورًا هائلاً يزيد عن مليون مستخدم كل شهر. يبدو أنه خبير يتمتع بخبرة 10 سنوات في تحسين محركات البحث والتسويق الرقمي. تم ذكر دامير في Mashable، Wired، Cointelegraphو The New Yorker و Inside.com و Entrepreneur و BeInCrypto ومنشورات أخرى. يسافر بين الإمارات العربية المتحدة وتركيا وروسيا ورابطة الدول المستقلة كبدو رقمي. حصل دامير على درجة البكالوريوس في الفيزياء ، والذي يعتقد أنه منحه مهارات التفكير النقدي اللازمة للنجاح في المشهد المتغير باستمرار للإنترنت.