تقرير الأخبار التكنولوجيا
16 نيسان 2026

جوجل تكشف النقاب عن Gemini 3.1 Flash TTS: حقبة جديدة من توليد الكلام بالذكاء الاصطناعي فائق الواقعية والقابل للتحكم الكامل

في سطور

أصدرت جوجل Gemini 3.1 Flash TTS، وهو نموذج متطور لتحويل النص إلى كلام مع تحكم محسّن، وتعبيرية، ودعم متعدد اللغات لتطبيقات الصوت التي تعمل بالذكاء الاصطناعي.

جوجل تكشف النقاب عن Gemini 3.1 Flash TTS: حقبة جديدة من توليد الكلام بالذكاء الاصطناعي فائق الواقعية والقابل للتحكم الكامل

شركة التكنولوجيا جوجل أعلنت الشركة عن إصدار Gemini 3.1 Flash Text-to-Speech (TTS)، وهو نموذج جديد لتوليف الكلام مصمم لتحسين قابلية التحكم والتعبير وجودة الإخراج للمطورين والمؤسسات والمستخدمين النهائيين الذين يقومون ببناء تطبيقات صوتية مدعومة بالذكاء الاصطناعي.

يجري حاليًا طرح تقنية تحويل النص إلى كلام (TTS) من نوع Gemini 3.1 Flash عبر منصات جوجل المتعددة. يتوفر النموذج بنسخة تجريبية للمطورين عبر واجهة برمجة تطبيقات Gemini وGoogle AI Studio، بينما يمكن لمستخدمي المؤسسات الوصول إليه بنسخة تجريبية عبر Vertex AI. كما يجري إدخال التكامل لمستخدمي Google Workspace عبر Google Vids، مما يوسع نطاق توفر النموذج ليشمل بيئات المستخدمين العاديين والمهنيين.

يمثل النظام المُحدَّث نقلةً نوعيةً في مجال توليد الصوت الاصطناعي، حيث أفادت جوجل بتحسيناتٍ ملموسةٍ في طبيعية الصوت وقدرته التعبيرية. ووفقًا لتقييمٍ معياريٍّ مستقلٍّ أجرته شركة Artificial Analysis، التي تُقيِّم بيانات تفضيلات المستخدمين واسعة النطاق لنماذج الكلام، حقق نظام Gemini 3.1 Flash TTS درجة Elo بلغت 1,211. ويضع هذا التقييم النموذج ضمن فئة الأداء العالي، إذ يجمع بين جودة صوتٍ عاليةٍ وخصائص تكلفةٍ فعّالةٍ نسبيًا. كما يدعم النظام أكثر من 70 لغةً، ويتضمن وظيفة حوارٍ متعدد المتحدثين، إلى جانب خيارات تحكمٍ دقيقةٍ تعتمد على مدخلات اللغة الطبيعية.

أدوات تحكم موسعة وتوجيه إبداعي لتوليد الكلام

من أبرز ميزات هذا الإصدار إضافة علامات الصوت، وهي آلية تُمكّن المستخدمين من توجيه إخراج الكلام بدقة أكبر من خلال تضمين تعليمات مُهيكلة مباشرةً في النصوص. تتيح هذه الأدوات إمكانية ضبط السرعة والنبرة والأسلوب الصوتي ضمن عملية إنتاج واحدة. كما يدعم النظام التوجيه متعدد الطبقات، مما يسمح للمطورين بـ defiسياق المشهد الجديد، وتعيين أدوار المتحدث من خلال ملفات تعريف الصوت القابلة للتكوين، وتعديل سمات التسليم على المستويين العالمي ومستوى الجملة.

في بيئات المؤسسات التي تستخدم تقنية Vertex AI، تهدف هذه الأدوات إلى دعم حالات استخدام إنتاجية أكثر تقدماً، بما في ذلك توليد الصوت القابل للتوسع للتطبيقات التي تتطلب أصوات شخصيات متسقة أو أنظمة حوار ديناميكية. كما تتضمن هذه الميزة وظيفة تصدير، مما يسمح بتحويل التكوينات المُولَّدة إلى تنسيقات جاهزة للاستخدام عبر واجهة برمجة التطبيقات (API) لنشرها على مختلف المنصات والخدمات.

تم تصميم هذا النموذج ليكون مناسبًا للتطبيق على نطاق عالمي، مع أداء ثابت عبر أكثر من 70 لغة. وتتكامل هذه القدرة متعددة اللغات مع تحكم مُحسّن في النبرة، مما يُتيح مخرجات كلامية أكثر ملاءمةً للسياقات اللغوية المختلفة وأكثر طبيعية.

أشارت نتائج الاختبارات الأولية من المطورين ومستخدمي المؤسسات إلى زيادة دقة تصميم الصوت ومرونة أكبر في صياغة التعبير الصوتي. وقد تم تسليط الضوء على استخدام علامات الصوت كإضافة مهمة لبناء تفاعلات صوتية أكثر تعقيدًا، لا سيما في السيناريوهات التي تتطلب توليد صوت قائم على الشخصيات أو السرد القصصي.

جميع مخرجات الصوت المُولّدة عبر نظام Gemini 3.1 Flash TTS مُدمجة بتقنية SynthID للعلامات المائية. يُضيف هذا النظام مُعرّفًا غير مرئي ضمن محتوى الصوت المُولّد، مما يُتيح الكشف عن الوسائط المُولّدة بالذكاء الاصطناعي، ويدعم الجهود المبذولة لتحسين أصالة المحتوى والحدّ من مخاطر إساءة استخدامه.

الرسوم (تاج):

إخلاء مسؤولية

تتماشى مع المبادئ التوجيهية لمشروع الثقةيرجى ملاحظة أن المعلومات المقدمة في هذه الصفحة ليس المقصود منها ولا ينبغي تفسيرها على أنها نصيحة قانونية أو ضريبية أو استثمارية أو مالية أو أي شكل آخر من أشكال المشورة. من المهم أن تستثمر فقط ما يمكنك تحمل خسارته وأن تطلب مشورة مالية مستقلة إذا كانت لديك أي شكوك. لمزيد من المعلومات، نقترح الرجوع إلى الشروط والأحكام بالإضافة إلى صفحات المساعدة والدعم المقدمة من جهة الإصدار أو المعلن. MetaversePost تلتزم بتقارير دقيقة وغير متحيزة، ولكن ظروف السوق عرضة للتغيير دون إشعار.

نبذة عن الكاتب

أليسا، صحفية متخصصة في MPost، متخصص في العملات المشفرة والذكاء الاصطناعي والاستثمارات ومجال واسع من Web3. مع اهتمامها الشديد بالاتجاهات والتقنيات الناشئة، فإنها تقدم تغطية شاملة لإعلام القراء وإشراكهم في المشهد المتطور باستمرار للتمويل الرقمي.

المزيد من المقالات
أليسا ديفيدسون
أليسا ديفيدسون

أليسا، صحفية متخصصة في MPost، متخصص في العملات المشفرة والذكاء الاصطناعي والاستثمارات ومجال واسع من Web3. مع اهتمامها الشديد بالاتجاهات والتقنيات الناشئة، فإنها تقدم تغطية شاملة لإعلام القراء وإشراكهم في المشهد المتطور باستمرار للتمويل الرقمي.

Hot Stories
اشترك في صحيفتنا الإخبارية.
آخـر الأخبار

الهدوء الذي يسبق عاصفة سولانا: ما تقوله الرسوم البيانية والحيتان وإشارات السلسلة الآن

وقد أظهرت سولانا أداءً قوياً، مدفوعاً بزيادة التبني والاهتمام المؤسسي والشراكات الرئيسية، في حين واجهت إمكانات كبيرة.

المزيد

العملات المشفرة في أبريل 2025: الاتجاهات الرئيسية والتحولات وما سيأتي بعد ذلك

في أبريل 2025، ركزت مساحة التشفير على تعزيز البنية التحتية الأساسية، مع استعداد Ethereum لـ Pectra ...

المزيد
اقرأ المزيد
اقراء المزيد
تجميد 450 مليون دولار أمريكي وما زال العدد في ازدياد: وحدة مكافحة الجرائم المالية T3 المدعومة بعملة Tether توسع حملتها العالمية على تدفقات العملات المشفرة غير المشروعة
تقرير الأخبار
تجميد 450 مليون دولار أمريكي وما زال العدد في ازدياد: وحدة مكافحة الجرائم المالية T3 المدعومة بعملة Tether توسع حملتها العالمية على تدفقات العملات المشفرة غير المشروعة
14 أيار 2026
سلسلة BNB تستهدف التهديدات السيبرانية المستقبلية من خلال ترقية مقاومة للحوسبة الكمومية
تقرير الأخبار التكنولوجيا
سلسلة BNB تستهدف التهديدات السيبرانية المستقبلية من خلال ترقية مقاومة للحوسبة الكمومية
14 أيار 2026
يقوم برنامج AutoScientist من Adaption بأتمتة ضبط النموذج بدقة من خلال التدريب ذي الحلقة المغلقة، متفوقًا بذلك على التكوينات المصممة يدويًا. 
تقرير الأخبار التكنولوجيا
يقوم برنامج AutoScientist من Adaption بأتمتة ضبط النموذج بدقة من خلال التدريب ذي الحلقة المغلقة، متفوقًا بذلك على التكوينات المصممة يدويًا. 
14 أيار 2026
اندفاع الذكاء الاصطناعي نحو عالم التجميل: ماذا يكشف لنا برنامج لوريال للشركات الناشئة حقًا عن مستقبل هذه الصناعة؟
مراجعة إدارة الأعمال التكنولوجيا
اندفاع الذكاء الاصطناعي نحو عالم التجميل: ماذا يكشف لنا برنامج لوريال للشركات الناشئة حقًا عن مستقبل هذه الصناعة؟
14 أيار 2026
CRYPTOMERIA LABS PTE. المحدودة.