تقدم Google AudioPaLM ، نموذج لغة AI قوي لتوليد الكلام
في سطور
AudioPaLM هو نموذج لغة قوي تم تطويره بواسطة شراء مراجعات جوجل الذي يجمع بين النماذج المستندة إلى النص والكلام لمعالجة الكلام والنص بشكل سلس.
يحافظ على المعلومات شبه اللغوية ويتفوق على الأنظمة الحالية في مهام ترجمة الكلام.
يمكن لبرنامج AudioPaLM ترجمة اللغات المحركة وإجراء عمليات نقل الصوت لترجمة الكلام إلى كلام.
كشفت Google النقاب عن نموذج لغة يسمى الصوت، الذي يجمع بين النماذج اللغوية المستندة إلى النص وتلك القائمة على الكلام لمعالجة الكلام والنص وتوليدهما بسلاسة. من خلال دمج قدرات بالم-2 و AudioLM، تقدم AudioPaLM بنية موحدة متعددة الوسائط تفتح مجموعة واسعة من التطبيقات ، بما في ذلك التعرف على الكلام وترجمة الكلام إلى كلام.
تتمثل إحدى الميزات البارزة لبرنامج AudioPaLM في قدرته على الحفاظ على المعلومات شبه اللغوية مثل هوية المتحدث ونبرة الصوت ، وذلك بفضل تأثير AudioLM. في الوقت نفسه ، تسخر المعرفة اللغوية الموجودة في نماذج اللغة القائمة على النص مثل PaLM-2. من خلال تهيئة AudioPaLM بأوزان نموذج لغة كبير للنص فقط ، يتفوق النموذج في معالجة الكلام ، مستفيدًا من بيانات التدريب النصي الشاملة المستخدمة في التدريب المسبق.
تم إثبات القدرات الرائعة لبرنامج AudioPaLM من خلال تجارب مختلفة. لقد تفوق على الأنظمة الحالية في مهام ترجمة الكلام ويظهر القدرة على أداء اللقطة الصفرية ترجمة الكلام إلى نص للغات التي لم يتم مواجهتها أثناء التدريب.
بالإضافة إلى ذلك ، يعرض AudioPaLM ميزات نماذج لغة الصوت عن طريق نقل الأصوات عبر اللغات بناءً على المطالبات المنطوقة القصيرة.
جعلت جوجل أمثلة على قدرات AudioPaLM متاح للاستكشاف. أثارت قدرة النموذج على ترجمة اللغات بلهجات مميزة ، مثل الإيطالية والألمانية ، اهتمام الباحثين والمستخدمين على حدٍ سواء. علاوة على ذلك ، فإن كفاءته في إجراء عمليات نقل الصوت لترجمة الكلام إلى كلام يميزه عن الخطوط الأساسية الحالية ، كما أكده كل من المقاييس التلقائية والمقيّمين البشريين.
النموذج جيد جدًا في ترجمة لغة من صوت إلى صوت بلغة أخرى ، مع الحفاظ على صوت وعواطف الشخص. من المثير للاهتمام ، عند ترجمة بعض اللغات مثل الإيطالية والألمانية ، أن النموذج له لهجة ملحوظة ، وعند ترجمة أخرى ، على سبيل المثال ، الفرنسية ، فإنه يتحدث بلكنة أمريكية مثالية.
اقرأ المزيد عن الذكاء الاصطناعي:
إخلاء المسئولية
تتماشى مع المبادئ التوجيهية لمشروع الثقةيرجى ملاحظة أن المعلومات المقدمة في هذه الصفحة ليس المقصود منها ولا ينبغي تفسيرها على أنها نصيحة قانونية أو ضريبية أو استثمارية أو مالية أو أي شكل آخر من أشكال المشورة. من المهم أن تستثمر فقط ما يمكنك تحمل خسارته وأن تطلب مشورة مالية مستقلة إذا كانت لديك أي شكوك. لمزيد من المعلومات، نقترح الرجوع إلى الشروط والأحكام بالإضافة إلى صفحات المساعدة والدعم المقدمة من جهة الإصدار أو المعلن. MetaversePost تلتزم بتقارير دقيقة وغير متحيزة، ولكن ظروف السوق عرضة للتغيير دون إشعار.
نبذة عن الكاتب
دامير هو قائد الفريق ومدير المنتج والمحرر في Metaverse Post، تغطي موضوعات مثل AI / ML و AGI و LLMs و Metaverse و Web3-حقول ذات صله. تجذب مقالاته جمهورًا هائلاً يزيد عن مليون مستخدم كل شهر. يبدو أنه خبير يتمتع بخبرة 10 سنوات في تحسين محركات البحث والتسويق الرقمي. تم ذكر دامير في Mashable، Wired، Cointelegraphو The New Yorker و Inside.com و Entrepreneur و BeInCrypto ومنشورات أخرى. يسافر بين الإمارات العربية المتحدة وتركيا وروسيا ورابطة الدول المستقلة كبدو رقمي. حصل دامير على درجة البكالوريوس في الفيزياء ، والذي يعتقد أنه منحه مهارات التفكير النقدي اللازمة للنجاح في المشهد المتغير باستمرار للإنترنت.
المزيد من المقالاتدامير هو قائد الفريق ومدير المنتج والمحرر في Metaverse Post، تغطي موضوعات مثل AI / ML و AGI و LLMs و Metaverse و Web3-حقول ذات صله. تجذب مقالاته جمهورًا هائلاً يزيد عن مليون مستخدم كل شهر. يبدو أنه خبير يتمتع بخبرة 10 سنوات في تحسين محركات البحث والتسويق الرقمي. تم ذكر دامير في Mashable، Wired، Cointelegraphو The New Yorker و Inside.com و Entrepreneur و BeInCrypto ومنشورات أخرى. يسافر بين الإمارات العربية المتحدة وتركيا وروسيا ورابطة الدول المستقلة كبدو رقمي. حصل دامير على درجة البكالوريوس في الفيزياء ، والذي يعتقد أنه منحه مهارات التفكير النقدي اللازمة للنجاح في المشهد المتغير باستمرار للإنترنت.