طورت Meta نظامًا ذكيًا للكلام مفتوح المصدر يتعرف على أكثر من 4,000 لغة منطوقة
في سطور
يمكن لمشروع MMS الخاص بالشركة التعرف على أكثر من 4,000 لغة.
مثل معظم مشاريع الذكاء الاصطناعي الأخرى المعلنة علنًا ، تشارك Meta نماذجها ورموزها للمساعدة في الحفاظ على التنوع اللغوي.
من خلال هذا العمل ، يأملون في تقديم مساهمة صغيرة للحفاظ على التنوع اللغوي المذهل في العالم.
مييتااا لقد خلق نموذج لغة AI يعد تطورًا منعشًا ChatGPT. المصدر المفتوح مشروع MMS تم إنشاؤه للحفاظ على التنوع اللغوي وتشجيع البحث ويمكنه التعرف على أكثر من 4,000 لغة منطوقة وإنتاج نص (كلام) في أكثر من 1,100 لغة. تمتلك الشركة صدر علنا نماذجها ورمزها اليوم لتعزيز أهدافها.
كتب ميتا: "نحن نشارك علنًا إبداعاتنا ورموزنا من أجل تشجيع الآخرين في مجتمع البحث على البناء على عملنا". "من خلال هذا المسعى ، نأمل في الحفاظ على التنوع الهائل للغات في العالم."
تعد صعوبة تدريب أدوات التعرف على الكلام ونماذج تحويل النص إلى كلام على كميات كبيرة من الصوت بدون تسميات النسخ أمرًا معتادًا. التسميات حاسمة ل آلة التعلم، والتي يمكنها تحديد البيانات وتصنيفها بشكل صحيح. ومع ذلك ، بالنسبة للغات التي ستختفي في العقود القادمة ، "هذه البيانات ببساطة غير موجودة" ، كما يشرح ميتا.
استخدمت Meta التسجيلات الصوتية للنصوص الدينية لجمع البيانات بطريقة غير تقليدية. وقالت الشركة: "لقد استخدمنا ترجمات لنصوص دينية مثل الكتاب المقدس ، والتي تمت دراستها على نطاق واسع لأبحاث الترجمة اللغوية القائمة على النصوص في العديد من اللغات لأنها تُرجمت إلى العديد من اللغات المختلفة". استخرجنا التسجيلات الصوتية للأشخاص الذين يقرؤون هذه النصوص بلغات مختلفة من الترجمات المتاحة للجمهور ". أضاف باحثو Meta أكثر من 4,000 لغة إلى ملف نموذج.
يبدو هذا النهج وكأنه وصفة لنموذج ذكاء اصطناعي متحيز بشدة يفضل وجهات النظر المسيحية للعالم. ومع ذلك ، قبل أن تسخر من الفكرة ، ضعها في اعتبارك من منظور Meta: يعتقد الباحثون أن هذا هو الحال لأنهم يستخدمون تصنيفًا زمنيًا لاتصال CTC (أو نموذج تسلسل إلى تسلسل أو نوع تسلسل) يكون محدودًا بدرجة أكبر من حيث المصطلحات من القوة الحسابية مقارنة مع نماذج اللغات الكبيرة (تُعرف أيضًا باسم أنواع التسلسل) أو النماذج المتسلسلة للتعرف على الكلام. تقول ميتا إن هذا لم ينتج عنه تحيز للذكور في التسجيلات الدينية التي سجلها معظم المتحدثين الذكور.
استخدمت Meta wav2vec 2.0 ، وهو نموذج "تعلم تمثيل الكلام تحت الإشراف الذاتي" ، لتدريب wav2vec 2.0 نموذج المحاذاة مما يجعل البيانات أكثر قابلية للاستخدام. أدى نموذج الكلام الخاضع للإشراف الذاتي الذي أشرف عليه Meta ذاتيًا من البيانات غير المسماة إلى نتائج رائعة. وجدت Meta أن نماذج الكلام متعددة اللغات على نطاق واسع تؤدي أداءً جيدًا مقارنة بالنماذج الحالية وتغطي 10 أضعاف اللغات ، خاصةً بالمقارنة مع همس. حققت Meta معدل أخطاء نصف الكلمات ، بينما غطت Massively Multilingual Speech 11 ضعف عدد اللغات.
تقول Meta أن نماذجها الجديدة لتحويل الكلام إلى نص ليست مثالية. على سبيل المثال ، قد يخطئون في ترجمة الكلمات أو العبارات ، مما قد يؤدي إلى كلام مسيء و / أو غير صحيح ، كما كتبت الشركة. يجب تحقيق التطوير المسؤول لتقنيات الذكاء الاصطناعي من خلال التعاون بين مجتمع الذكاء الاصطناعي.
نظرًا لأن Meta قد أصدرت MMS للبحث مفتوح المصدر ، فإنها تأمل أن تتمكن من عكس اتجاه اختفاء استخدام اللغة. في هذه الرؤية ، قد تسمح التكنولوجيا المساعدة ، وتحويل النص إلى كلام ، وحتى الواقع الافتراضي وتقنية الواقع المعزز للجميع بالتحدث والتعلم بلغاتهم الأصلية. وذكر ، "نحن نتخيل عالمًا يكون للتكنولوجيا فيه تأثير معاكس ، مما يدفع الناس إلى الحفاظ على لغاتهم حية حيث يمكنهم الوصول إلى المعلومات واستخدام التكنولوجيا من خلال التحدث بلغتهم المفضلة."
- في الآونة الأخيرة ، ميتا أعلنت النتائج المالية للربع الأول من عام 2023. على الرغم من جهود إعادة الهيكلة الأخيرة ، فاجأت الشركة المستثمرين بزيادة غير متوقعة في المبيعات للربع الأول. وصعدت الأسهم 12 بالمئة يوم الأربعاء.
اقرأ المزيد من المقالات ذات الصلة:
- خضع 4,000 شخص للعلاج النفسي باستخدام الروبوت بدون علم
- تعطيل الاضطراب: كيف ستتولى عناوين لوحة النقل الآني الخاصة بالمرحلة Metaverse.
- تقيد FTC طموحات Meta للواقع الافتراضي بدعوى قضائية
إخلاء المسئولية
تتماشى مع المبادئ التوجيهية لمشروع الثقةيرجى ملاحظة أن المعلومات المقدمة في هذه الصفحة ليس المقصود منها ولا ينبغي تفسيرها على أنها نصيحة قانونية أو ضريبية أو استثمارية أو مالية أو أي شكل آخر من أشكال المشورة. من المهم أن تستثمر فقط ما يمكنك تحمل خسارته وأن تطلب مشورة مالية مستقلة إذا كانت لديك أي شكوك. لمزيد من المعلومات، نقترح الرجوع إلى الشروط والأحكام بالإضافة إلى صفحات المساعدة والدعم المقدمة من جهة الإصدار أو المعلن. MetaversePost تلتزم بتقارير دقيقة وغير متحيزة، ولكن ظروف السوق عرضة للتغيير دون إشعار.
نبذة عن الكاتب
دامير هو قائد الفريق ومدير المنتج والمحرر في Metaverse Post، تغطي موضوعات مثل AI / ML و AGI و LLMs و Metaverse و Web3-حقول ذات صله. تجذب مقالاته جمهورًا هائلاً يزيد عن مليون مستخدم كل شهر. يبدو أنه خبير يتمتع بخبرة 10 سنوات في تحسين محركات البحث والتسويق الرقمي. تم ذكر دامير في Mashable، Wired، Cointelegraphو The New Yorker و Inside.com و Entrepreneur و BeInCrypto ومنشورات أخرى. يسافر بين الإمارات العربية المتحدة وتركيا وروسيا ورابطة الدول المستقلة كبدو رقمي. حصل دامير على درجة البكالوريوس في الفيزياء ، والذي يعتقد أنه منحه مهارات التفكير النقدي اللازمة للنجاح في المشهد المتغير باستمرار للإنترنت.
المزيد من المقالاتدامير هو قائد الفريق ومدير المنتج والمحرر في Metaverse Post، تغطي موضوعات مثل AI / ML و AGI و LLMs و Metaverse و Web3-حقول ذات صله. تجذب مقالاته جمهورًا هائلاً يزيد عن مليون مستخدم كل شهر. يبدو أنه خبير يتمتع بخبرة 10 سنوات في تحسين محركات البحث والتسويق الرقمي. تم ذكر دامير في Mashable، Wired، Cointelegraphو The New Yorker و Inside.com و Entrepreneur و BeInCrypto ومنشورات أخرى. يسافر بين الإمارات العربية المتحدة وتركيا وروسيا ورابطة الدول المستقلة كبدو رقمي. حصل دامير على درجة البكالوريوس في الفيزياء ، والذي يعتقد أنه منحه مهارات التفكير النقدي اللازمة للنجاح في المشهد المتغير باستمرار للإنترنت.