تقرير الأخبار تكنولوجيا
26 حزيران، 2023

تقدم Google AudioPaLM ، نموذج لغة AI قوي لتوليد الكلام

في سطور

AudioPaLM هو نموذج لغة قوي تم تطويره بواسطة شراء مراجعات جوجل الذي يجمع بين النماذج المستندة إلى النص والكلام لمعالجة الكلام والنص بشكل سلس.

يحافظ على المعلومات شبه اللغوية ويتفوق على الأنظمة الحالية في مهام ترجمة الكلام.

يمكن لبرنامج AudioPaLM ترجمة اللغات المحركة وإجراء عمليات نقل الصوت لترجمة الكلام إلى كلام.

كشفت Google النقاب عن نموذج لغة يسمى الصوت، الذي يجمع بين النماذج اللغوية المستندة إلى النص وتلك القائمة على الكلام لمعالجة الكلام والنص وتوليدهما بسلاسة. من خلال دمج قدرات بالم-2 و AudioLM، تقدم AudioPaLM بنية موحدة متعددة الوسائط تفتح مجموعة واسعة من التطبيقات ، بما في ذلك التعرف على الكلام وترجمة الكلام إلى كلام.

تقدم Google AudioPaLM ، نموذج لغة قوي لتوليد الكلام
الائتمان: Metaverse Post (mpost.io)

تتمثل إحدى الميزات البارزة لبرنامج AudioPaLM في قدرته على الحفاظ على المعلومات شبه اللغوية مثل هوية المتحدث ونبرة الصوت ، وذلك بفضل تأثير AudioLM. في الوقت نفسه ، تسخر المعرفة اللغوية الموجودة في نماذج اللغة القائمة على النص مثل PaLM-2. من خلال تهيئة AudioPaLM بأوزان نموذج لغة كبير للنص فقط ، يتفوق النموذج في معالجة الكلام ، مستفيدًا من بيانات التدريب النصي الشاملة المستخدمة في التدريب المسبق.

تم إثبات القدرات الرائعة لبرنامج AudioPaLM من خلال تجارب مختلفة. لقد تفوق على الأنظمة الحالية في مهام ترجمة الكلام ويظهر القدرة على أداء اللقطة الصفرية ترجمة الكلام إلى نص للغات التي لم يتم مواجهتها أثناء التدريب.

بالإضافة إلى ذلك ، يعرض AudioPaLM ميزات نماذج لغة الصوت عن طريق نقل الأصوات عبر اللغات بناءً على المطالبات المنطوقة القصيرة.

جعلت جوجل أمثلة على قدرات AudioPaLM متاح للاستكشاف. أثارت قدرة النموذج على ترجمة اللغات بلهجات مميزة ، مثل الإيطالية والألمانية ، اهتمام الباحثين والمستخدمين على حدٍ سواء. علاوة على ذلك ، فإن كفاءته في إجراء عمليات نقل الصوت لترجمة الكلام إلى كلام يميزه عن الخطوط الأساسية الحالية ، كما أكده كل من المقاييس التلقائية والمقيّمين البشريين.

النموذج جيد جدًا في ترجمة لغة من صوت إلى صوت بلغة أخرى ، مع الحفاظ على صوت وعواطف الشخص. من المثير للاهتمام ، عند ترجمة بعض اللغات مثل الإيطالية والألمانية ، أن النموذج له لهجة ملحوظة ، وعند ترجمة أخرى ، على سبيل المثال ، الفرنسية ، فإنه يتحدث بلكنة أمريكية مثالية.

نموذج AudioPaLM مع أمثلة على ترجمة الكلام إلى كلام والتعرف التلقائي على الكلام.

اقرأ المزيد عن الذكاء الاصطناعي:

إخلاء المسئولية

تتماشى مع المبادئ التوجيهية لمشروع الثقةيرجى ملاحظة أن المعلومات المقدمة في هذه الصفحة ليس المقصود منها ولا ينبغي تفسيرها على أنها نصيحة قانونية أو ضريبية أو استثمارية أو مالية أو أي شكل آخر من أشكال المشورة. من المهم أن تستثمر فقط ما يمكنك تحمل خسارته وأن تطلب مشورة مالية مستقلة إذا كانت لديك أي شكوك. لمزيد من المعلومات، نقترح الرجوع إلى الشروط والأحكام بالإضافة إلى صفحات المساعدة والدعم المقدمة من جهة الإصدار أو المعلن. MetaversePost تلتزم بتقارير دقيقة وغير متحيزة، ولكن ظروف السوق عرضة للتغيير دون إشعار.

نبذة عن الكاتب

دامير هو قائد الفريق ومدير المنتج والمحرر في Metaverse Post، تغطي موضوعات مثل AI / ML و AGI و LLMs و Metaverse و Web3-حقول ذات صله. تجذب مقالاته جمهورًا هائلاً يزيد عن مليون مستخدم كل شهر. يبدو أنه خبير يتمتع بخبرة 10 سنوات في تحسين محركات البحث والتسويق الرقمي. تم ذكر دامير في Mashable، Wired، Cointelegraphو The New Yorker و Inside.com و Entrepreneur و BeInCrypto ومنشورات أخرى. يسافر بين الإمارات العربية المتحدة وتركيا وروسيا ورابطة الدول المستقلة كبدو رقمي. حصل دامير على درجة البكالوريوس في الفيزياء ، والذي يعتقد أنه منحه مهارات التفكير النقدي اللازمة للنجاح في المشهد المتغير باستمرار للإنترنت. 

المزيد من المقالات
دامير يالالوف
دامير يالالوف

دامير هو قائد الفريق ومدير المنتج والمحرر في Metaverse Post، تغطي موضوعات مثل AI / ML و AGI و LLMs و Metaverse و Web3-حقول ذات صله. تجذب مقالاته جمهورًا هائلاً يزيد عن مليون مستخدم كل شهر. يبدو أنه خبير يتمتع بخبرة 10 سنوات في تحسين محركات البحث والتسويق الرقمي. تم ذكر دامير في Mashable، Wired، Cointelegraphو The New Yorker و Inside.com و Entrepreneur و BeInCrypto ومنشورات أخرى. يسافر بين الإمارات العربية المتحدة وتركيا وروسيا ورابطة الدول المستقلة كبدو رقمي. حصل دامير على درجة البكالوريوس في الفيزياء ، والذي يعتقد أنه منحه مهارات التفكير النقدي اللازمة للنجاح في المشهد المتغير باستمرار للإنترنت. 

Hot Stories
اشترك في صحيفتنا الإخبارية.
آخـر الأخبار

تنمو الشهية المؤسسية تجاه صناديق الاستثمار المتداولة في البيتكوين وسط التقلبات

تكشف الإفصاحات من خلال ملفات 13F عن مستثمرين مؤسسيين بارزين يشتغلون بصناديق الاستثمار المتداولة في البيتكوين، مما يؤكد القبول المتزايد لـ ...

لمعرفة المزيد

وصول يوم النطق بالحكم: مصير تشيكوسلوفاكيا معلق في الميزان بينما تنظر المحكمة الأمريكية في التماس وزارة العدل

ومن المقرر أن يواجه Changpeng Zhao الحكم في محكمة أمريكية في سياتل اليوم.

لمعرفة المزيد
انضم إلى مجتمعنا التقني المبتكر
تفاصيل أكثر
المزيد
تتعاون Espresso Systems مع Polygon Labs لتطوير طبقة AggLayer لتحسين إمكانية التشغيل البيني المجمع
باقة الأعمال تقرير الأخبار تكنولوجيا
تتعاون Espresso Systems مع Polygon Labs لتطوير طبقة AggLayer لتحسين إمكانية التشغيل البيني المجمع
9 مايو 2024
بروتوكول البنية التحتية المدعوم من ZKP ZKBase يكشف عن خارطة الطريق ويخطط لإطلاق Testnet في مايو
تقرير الأخبار تكنولوجيا
بروتوكول البنية التحتية المدعوم من ZKP ZKBase يكشف عن خارطة الطريق ويخطط لإطلاق Testnet في مايو
9 مايو 2024
BLOCKCHANCE وCONF3RENCE يتحدان من أجل أكبر حدث في ألمانيا Web3 مؤتمر في دورتموند
باقة الأعمال الأسواق تطبيقات الكمبيوتر قصص ومراجعات تكنولوجيا
BLOCKCHANCE وCONF3RENCE يتحدان من أجل أكبر حدث في ألمانيا Web3 مؤتمر في دورتموند
9 مايو 2024
يتم إطلاق NuLink على Bybit Web3 منصة ايدو. تمتد مرحلة الاشتراك حتى 13 مايو
الأسواق تقرير الأخبار تكنولوجيا
يتم إطلاق NuLink على Bybit Web3 منصة ايدو. تمتد مرحلة الاشتراك حتى 13 مايو
9 مايو 2024
CRYPTOMERIA LABS PTE. المحدودة.