نموذج جديد للذكاء الاصطناعي يجمع الكلام الواقعي باستخدام YouTube والبودكاست
في سطور
ابتكر باحثون من جامعة كارنيجي ميلون نموذجًا جديدًا للذكاء الاصطناعي قادرًا على توليد خطاب واقعي من خلال التعلم من مقاطع فيديو YouTube و دبليو.
كان النموذج قادرًا على تعلم الفروق الدقيقة في أنماط الكلام الطبيعية من خلال الاستماع إلى ما يقرب من 900 ساعة من YouTube ومحتوى البودكاست ، مما أدى إلى الحصول على صوت اصطناعي أكثر واقعية ونابضة بالحياة.
باحثون من جامعة كارنيجي ميلون بالولايات المتحدة الأمريكية قد صنع نموذج ذكاء اصطناعي جديد قادر على توليد كلام واقعي من خلال التعلم من مقاطع الفيديو والبودكاست على YouTube. النموذج قادر على إنتاج الكلام بمجموعة متنوعة من الأصوات واللهجات ، مما يجعله أداة مفيدة محتملة لصناعات مثل الترفيه والإعلان. يمكن أن يكون لها أيضًا آثار على أولئك الذين يعتمدون على التكنولوجيا المساعدة للتواصل.
يعد هذا تطورًا مهمًا ، حيث تم العثور على غالبية الكلام الذي تم إنشاؤه بواسطة الذكاء الاصطناعي ليكون بلا عاطفة ورتيبة نظرًا لحقيقة أنه يتم تدريبه عادةً على مجموعات البيانات حيث يتم تسجيل خطاب الممثلين المحترفين. يمكن استخدام التكنولوجيا الجديدة لتحسين أداء المساعدين الظاهريين وروبوتات المحادثة ، مما يجعلها أكثر تفاعلًا وتشبه الإنسان. كما أن لديها تطبيقات محتملة في مجالات مثل الألعاب والتعليم والترفيه.
ومع ذلك ، كان النموذج الجديد قادرًا على تعلم الفروق الدقيقة في أنماط الكلام الطبيعية ، مثل التوقفات المؤقتة ، والمداخلات ، والكلمات الطفيلية ، من خلال الاستماع إلى ما يقرب من 900 ساعة من YouTube ومحتوى البودكاست. نتج عن ذلك صوت اصطناعي أكثر واقعية ونابضة بالحياة ، والذي تم تقييمه 3.89 على مقياس من خمس نقاط من قبل الأشخاص الذين طُلب منهم تقييمه. هذا أعلى من متوسط الدرجات التي حصلت عليها نماذج الذكاء الاصطناعي المماثلة (سجل صوت بشري حقيقي 4.01).
التطبيقات المحتملة لهذه التكنولوجيا واسعة وتشمل مساعدة الأشخاص الذين يعانون من إعاقات في الكلام ، وتحسين أنظمة الملاحة ، وإنشاء المزيد من المساعدين الظاهريين الطبيعيين.
- بودكاست هو أول بودكاست أنتجته منظمة العفو الدولية على الإطلاق ، ويضم محاكاة ساخرة لجو روغان في مقابلة مع ستيف جوبز. تم إنشاء هذا البودكاست بالكامل بواسطة خوارزميات الكمبيوتر AI. تم تدريب الذكاء الاصطناعي على حلقة ستيف جوبز باستخدام كل من سيرته الذاتية وأي تسجيل له على الإنترنت يمكن اكتشافه. سمح هذا للذكاء الاصطناعي بإعادة تكوين شخصيته بأمانة.
اقرأ المزيد من المقالات ذات الصلة:
إخلاء المسئولية
تتماشى مع المبادئ التوجيهية لمشروع الثقةيرجى ملاحظة أن المعلومات المقدمة في هذه الصفحة ليس المقصود منها ولا ينبغي تفسيرها على أنها نصيحة قانونية أو ضريبية أو استثمارية أو مالية أو أي شكل آخر من أشكال المشورة. من المهم أن تستثمر فقط ما يمكنك تحمل خسارته وأن تطلب مشورة مالية مستقلة إذا كانت لديك أي شكوك. لمزيد من المعلومات، نقترح الرجوع إلى الشروط والأحكام بالإضافة إلى صفحات المساعدة والدعم المقدمة من جهة الإصدار أو المعلن. MetaversePost تلتزم بتقارير دقيقة وغير متحيزة، ولكن ظروف السوق عرضة للتغيير دون إشعار.
نبذة عن الكاتب
دامير هو قائد الفريق ومدير المنتج والمحرر في Metaverse Post، تغطي موضوعات مثل AI / ML و AGI و LLMs و Metaverse و Web3-حقول ذات صله. تجذب مقالاته جمهورًا هائلاً يزيد عن مليون مستخدم كل شهر. يبدو أنه خبير يتمتع بخبرة 10 سنوات في تحسين محركات البحث والتسويق الرقمي. تم ذكر دامير في Mashable، Wired، Cointelegraphو The New Yorker و Inside.com و Entrepreneur و BeInCrypto ومنشورات أخرى. يسافر بين الإمارات العربية المتحدة وتركيا وروسيا ورابطة الدول المستقلة كبدو رقمي. حصل دامير على درجة البكالوريوس في الفيزياء ، والذي يعتقد أنه منحه مهارات التفكير النقدي اللازمة للنجاح في المشهد المتغير باستمرار للإنترنت.
المزيد من المقالاتدامير هو قائد الفريق ومدير المنتج والمحرر في Metaverse Post، تغطي موضوعات مثل AI / ML و AGI و LLMs و Metaverse و Web3-حقول ذات صله. تجذب مقالاته جمهورًا هائلاً يزيد عن مليون مستخدم كل شهر. يبدو أنه خبير يتمتع بخبرة 10 سنوات في تحسين محركات البحث والتسويق الرقمي. تم ذكر دامير في Mashable، Wired، Cointelegraphو The New Yorker و Inside.com و Entrepreneur و BeInCrypto ومنشورات أخرى. يسافر بين الإمارات العربية المتحدة وتركيا وروسيا ورابطة الدول المستقلة كبدو رقمي. حصل دامير على درجة البكالوريوس في الفيزياء ، والذي يعتقد أنه منحه مهارات التفكير النقدي اللازمة للنجاح في المشهد المتغير باستمرار للإنترنت.