تقرير الأخبار تكنولوجيا
23 مايو 2023

طورت Meta نظامًا ذكيًا للكلام مفتوح المصدر يتعرف على أكثر من 4,000 لغة منطوقة

في سطور

يمكن لمشروع MMS الخاص بالشركة التعرف على أكثر من 4,000 لغة.

مثل معظم مشاريع الذكاء الاصطناعي الأخرى المعلنة علنًا ، تشارك Meta نماذجها ورموزها للمساعدة في الحفاظ على التنوع اللغوي.

من خلال هذا العمل ، يأملون في تقديم مساهمة صغيرة للحفاظ على التنوع اللغوي المذهل في العالم.

مييتااا لقد خلق نموذج لغة AI يعد تطورًا منعشًا ChatGPT. المصدر المفتوح مشروع MMS تم إنشاؤه للحفاظ على التنوع اللغوي وتشجيع البحث ويمكنه التعرف على أكثر من 4,000 لغة منطوقة وإنتاج نص (كلام) في أكثر من 1,100 لغة. تمتلك الشركة صدر علنا نماذجها ورمزها اليوم لتعزيز أهدافها.

كتب ميتا: "نحن نشارك علنًا إبداعاتنا ورموزنا من أجل تشجيع الآخرين في مجتمع البحث على البناء على عملنا". "من خلال هذا المسعى ، نأمل في الحفاظ على التنوع الهائل للغات في العالم."

طورت Meta نظامًا ذكيًا للخطاب مفتوح المصدر يتعرف على أكثر من 4,000 لغة منطوقة

تعد صعوبة تدريب أدوات التعرف على الكلام ونماذج تحويل النص إلى كلام على كميات كبيرة من الصوت بدون تسميات النسخ أمرًا معتادًا. التسميات حاسمة ل آلة التعلم، والتي يمكنها تحديد البيانات وتصنيفها بشكل صحيح. ومع ذلك ، بالنسبة للغات التي ستختفي في العقود القادمة ، "هذه البيانات ببساطة غير موجودة" ، كما يشرح ميتا.

استخدمت Meta التسجيلات الصوتية للنصوص الدينية لجمع البيانات بطريقة غير تقليدية. وقالت الشركة: "لقد استخدمنا ترجمات لنصوص دينية مثل الكتاب المقدس ، والتي تمت دراستها على نطاق واسع لأبحاث الترجمة اللغوية القائمة على النصوص في العديد من اللغات لأنها تُرجمت إلى العديد من اللغات المختلفة". استخرجنا التسجيلات الصوتية للأشخاص الذين يقرؤون هذه النصوص بلغات مختلفة من الترجمات المتاحة للجمهور ". أضاف باحثو Meta أكثر من 4,000 لغة إلى ملف نموذج.

يبدو هذا النهج وكأنه وصفة لنموذج ذكاء اصطناعي متحيز بشدة يفضل وجهات النظر المسيحية للعالم. ومع ذلك ، قبل أن تسخر من الفكرة ، ضعها في اعتبارك من منظور Meta: يعتقد الباحثون أن هذا هو الحال لأنهم يستخدمون تصنيفًا زمنيًا لاتصال CTC (أو نموذج تسلسل إلى تسلسل أو نوع تسلسل) يكون محدودًا بدرجة أكبر من حيث المصطلحات من القوة الحسابية مقارنة مع نماذج اللغات الكبيرة (تُعرف أيضًا باسم أنواع التسلسل) أو النماذج المتسلسلة للتعرف على الكلام. تقول ميتا إن هذا لم ينتج عنه تحيز للذكور في التسجيلات الدينية التي سجلها معظم المتحدثين الذكور.

استخدمت Meta wav2vec 2.0 ، وهو نموذج "تعلم تمثيل الكلام تحت الإشراف الذاتي" ، لتدريب wav2vec 2.0 نموذج المحاذاة مما يجعل البيانات أكثر قابلية للاستخدام. أدى نموذج الكلام الخاضع للإشراف الذاتي الذي أشرف عليه Meta ذاتيًا من البيانات غير المسماة إلى نتائج رائعة. وجدت Meta أن نماذج الكلام متعددة اللغات على نطاق واسع تؤدي أداءً جيدًا مقارنة بالنماذج الحالية وتغطي 10 أضعاف اللغات ، خاصةً بالمقارنة مع همس. حققت Meta معدل أخطاء نصف الكلمات ، بينما غطت Massively Multilingual Speech 11 ضعف عدد اللغات.

تقول Meta أن نماذجها الجديدة لتحويل الكلام إلى نص ليست مثالية. على سبيل المثال ، قد يخطئون في ترجمة الكلمات أو العبارات ، مما قد يؤدي إلى كلام مسيء و / أو غير صحيح ، كما كتبت الشركة. يجب تحقيق التطوير المسؤول لتقنيات الذكاء الاصطناعي من خلال التعاون بين مجتمع الذكاء الاصطناعي.

نظرًا لأن Meta قد أصدرت MMS للبحث مفتوح المصدر ، فإنها تأمل أن تتمكن من عكس اتجاه اختفاء استخدام اللغة. في هذه الرؤية ، قد تسمح التكنولوجيا المساعدة ، وتحويل النص إلى كلام ، وحتى الواقع الافتراضي وتقنية الواقع المعزز للجميع بالتحدث والتعلم بلغاتهم الأصلية. وذكر ، "نحن نتخيل عالمًا يكون للتكنولوجيا فيه تأثير معاكس ، مما يدفع الناس إلى الحفاظ على لغاتهم حية حيث يمكنهم الوصول إلى المعلومات واستخدام التكنولوجيا من خلال التحدث بلغتهم المفضلة."

  • في الآونة الأخيرة ، ميتا أعلنت النتائج المالية للربع الأول من عام 2023. على الرغم من جهود إعادة الهيكلة الأخيرة ، فاجأت الشركة المستثمرين بزيادة غير متوقعة في المبيعات للربع الأول. وصعدت الأسهم 12 بالمئة يوم الأربعاء.

اقرأ المزيد من المقالات ذات الصلة:

إخلاء المسئولية

تتماشى مع المبادئ التوجيهية لمشروع الثقةيرجى ملاحظة أن المعلومات المقدمة في هذه الصفحة ليس المقصود منها ولا ينبغي تفسيرها على أنها نصيحة قانونية أو ضريبية أو استثمارية أو مالية أو أي شكل آخر من أشكال المشورة. من المهم أن تستثمر فقط ما يمكنك تحمل خسارته وأن تطلب مشورة مالية مستقلة إذا كانت لديك أي شكوك. لمزيد من المعلومات، نقترح الرجوع إلى الشروط والأحكام بالإضافة إلى صفحات المساعدة والدعم المقدمة من جهة الإصدار أو المعلن. MetaversePost تلتزم بتقارير دقيقة وغير متحيزة، ولكن ظروف السوق عرضة للتغيير دون إشعار.

نبذة عن الكاتب

دامير هو قائد الفريق ومدير المنتج والمحرر في Metaverse Post، تغطي موضوعات مثل AI / ML و AGI و LLMs و Metaverse و Web3-حقول ذات صله. تجذب مقالاته جمهورًا هائلاً يزيد عن مليون مستخدم كل شهر. يبدو أنه خبير يتمتع بخبرة 10 سنوات في تحسين محركات البحث والتسويق الرقمي. تم ذكر دامير في Mashable، Wired، Cointelegraphو The New Yorker و Inside.com و Entrepreneur و BeInCrypto ومنشورات أخرى. يسافر بين الإمارات العربية المتحدة وتركيا وروسيا ورابطة الدول المستقلة كبدو رقمي. حصل دامير على درجة البكالوريوس في الفيزياء ، والذي يعتقد أنه منحه مهارات التفكير النقدي اللازمة للنجاح في المشهد المتغير باستمرار للإنترنت. 

المزيد من المقالات
دامير يالالوف
دامير يالالوف

دامير هو قائد الفريق ومدير المنتج والمحرر في Metaverse Post، تغطي موضوعات مثل AI / ML و AGI و LLMs و Metaverse و Web3-حقول ذات صله. تجذب مقالاته جمهورًا هائلاً يزيد عن مليون مستخدم كل شهر. يبدو أنه خبير يتمتع بخبرة 10 سنوات في تحسين محركات البحث والتسويق الرقمي. تم ذكر دامير في Mashable، Wired، Cointelegraphو The New Yorker و Inside.com و Entrepreneur و BeInCrypto ومنشورات أخرى. يسافر بين الإمارات العربية المتحدة وتركيا وروسيا ورابطة الدول المستقلة كبدو رقمي. حصل دامير على درجة البكالوريوس في الفيزياء ، والذي يعتقد أنه منحه مهارات التفكير النقدي اللازمة للنجاح في المشهد المتغير باستمرار للإنترنت. 

Hot Stories

Injective تتعاون مع AltLayer لجلب الأمن إلى inEVM

by أليسا ديفيدسون
03 مايو 2024
اشترك في صحيفتنا الإخبارية.
آخـر الأخبار

Injective تتعاون مع AltLayer لجلب الأمن إلى inEVM

by أليسا ديفيدسون
03 مايو 2024

تنمو الشهية المؤسسية تجاه صناديق الاستثمار المتداولة في البيتكوين وسط التقلبات

تكشف الإفصاحات من خلال ملفات 13F عن مستثمرين مؤسسيين بارزين يشتغلون بصناديق الاستثمار المتداولة في البيتكوين، مما يؤكد القبول المتزايد لـ ...

أعرف المزيد

وصول يوم النطق بالحكم: مصير تشيكوسلوفاكيا معلق في الميزان بينما تنظر المحكمة الأمريكية في التماس وزارة العدل

ومن المقرر أن يواجه Changpeng Zhao الحكم في محكمة أمريكية في سياتل اليوم.

أعرف المزيد
انضم إلى مجتمعنا التقني المبتكر
تفاصيل أكثر
المزيد
Injective تتعاون مع AltLayer لجلب الأمن إلى inEVM
باقة الأعمال تقرير الأخبار تكنولوجيا
Injective تتعاون مع AltLayer لجلب الأمن إلى inEVM
3 مايو 2024
تتعاون Masa مع Teller لتقديم مجمع إقراض MASA، مما يتيح اقتراض USDC على القاعدة
الأسواق تقرير الأخبار تكنولوجيا
تتعاون Masa مع Teller لتقديم مجمع إقراض MASA، مما يتيح اقتراض USDC على القاعدة
3 مايو 2024
تطلق Velodrome الإصدار التجريبي من Superchain في الأسابيع القادمة وتتوسع عبر OP Stack Layer 2 Blockchains
الأسواق تقرير الأخبار تكنولوجيا
تطلق Velodrome الإصدار التجريبي من Superchain في الأسابيع القادمة وتتوسع عبر OP Stack Layer 2 Blockchains
3 مايو 2024
تعلن CARV عن شراكة مع Aethir لتحقيق اللامركزية في طبقة البيانات الخاصة بها وتوزيع المكافآت
باقة الأعمال تقرير الأخبار تكنولوجيا
تعلن CARV عن شراكة مع Aethir لتحقيق اللامركزية في طبقة البيانات الخاصة بها وتوزيع المكافآت
3 مايو 2024
CRYPTOMERIA LABS PTE. المحدودة.