تظهر Guanaco كمصدر مفتوح محتمل ChatGPT منافس
في سطور
Guanaco، وهو برنامج دردشة مفتوح المصدر طوره باحثون من جامعة واشنطن، يطمح إلى التنافس معه ChatGPT بينما تتطلب وقتًا ومالًا أقل للتدريب.
ومع ذلك ، فقد شككت دراسة جديدة في فعالية نماذج مثل الألبكة.
كشف باحثون من جامعة واشنطن النقاب غوناق، برنامج chatbot مفتوح المصدر يهدف إلى منافسة أداء ChatGPT مع تقليل الوقت والموارد اللازمة للتدريب بشكل كبير. سمي على اسم أحد أقاربه في أمريكا الجنوبية llamaق، تم بناء Guanaco على LLaMA نموذج اللغة ويتضمن طريقة ضبط دقيقة جديدة تسمى QLoRA.
يدعي منشئو Guanaco أنه يحقق أداءً مشابهًا لـ ChatGPT ولكن يمكن تدريبها في يوم واحد فقط. أصبح هذا الإنجاز الرائع ممكنًا بفضل QLoRA، وهي تقنية ضبط دقيق لنموذج اللغة تقلل بشكل كبير من مقدار ذاكرة وحدة معالجة الرسومات اللازمة للتدريب. بينما ChatGPT يتطلب 780 جيجا بايت من ذاكرة GPU بالنسبة لطراز يحتوي على 65 مليار معلمة ، فإن أبسط إصدار من Guanaco لا يتطلب سوى 5 غيغابايت.
مع هذه المكاسب الرائعة في الكفاءة ، تتحدى Guanaco والنماذج مفتوحة المصدر المماثلة فكرة أن التدريب المكلف ضروري أحدث النماذج اللغوية. ظهور Guanaco ، صوف الألبكةو نماذج أخرى أدى هذا القطار بجزء بسيط من التكلفة إلى تكهنات حول مستقبل النماذج باهظة الثمن مثل GPT.
ومع ذلك ، لا يتفق الجميع مع هذه النظرة المتفائلة لنماذج مفتوحة المصدر. دراسة حديثة أجرتها جامعة كاليفورنيا ألقى بظلال من الشك حول قدرات نماذج مثل الألبكة وأثار تساؤلات حول إمكاناتها الحقيقية. في البداية، توصل الباحثون إلى استنتاج مماثل لمبدعي Guanaco: عندما يتم تدريب النماذج مفتوحة المصدر بشكل صحيح، فإنها يمكن أن تنافس GPT في القدرات. وكشفت اختبارات أخرى وجود قيود كبيرة. تتميز نماذج "دوللي" هذه، كما يطلق عليها أحيانًا، بالمهارة في تقليد حلول المشكلات التي واجهتها أثناء التدريب. ومع ذلك، فإنهم يكافحون من أجل الأداء الجيد في المهام التي لم يتعرضوا لها بشكل واضح، ويتخلفون عن النماذج الأكثر تقدمًا.
هذا الوحي يوحي بأن الملايين المستثمرة في التدريب GPT ونماذج مماثلة ربما لم تذهب سدى. بينما تظهر Guanaco ونظيراتها نتائج واعدة ، لا تزال هناك مجالات تتفوق فيها النماذج الأكثر تطوراً. من الجدير بالذكر أن ملف بحث أجرته جامعة كاليفورنيا يتحدى الفكرة السائدة بأن النماذج مفتوحة المصدر يمكن أن تحل محل النماذج الباهظة الثمن بشكل كامل GPT.
مع تطور مجال معالجة اللغة الطبيعية ، سيكون من المثير للاهتمام مشاهدة كيفية عرض Guanaco والنماذج مفتوحة المصدر الأخرى مقابل المعايير مثل ChatGPT. سيؤثر المعدل المرتفع للابتكار والبحث المستمر ، دون سؤال ، على مستقبل نماذج اللغة ويحدد النماذج التي تصبح الاختيار المفضل لتطبيقات معينة.
- Dolly 2.0 ، أول 12B Chat-LLM مفتوح المصدر ومتوفر تجاريًا ، تم الإعلان عنه بواسطة Databricks. يعد هذا تقدمًا كبيرًا لصناعة التعلم الآلي ، حيث يسمح للشركات بإنشاء نماذج لغة فعالة دون الاستثمار في مجموعات GPU المكلفة. أشركت Databricks 5,000 موظف لإنشاء نموذج لغتهم مفتوحة المصدر ، والذي تضمن نموذج لغة Pythia-12B الخاص بـ EleutherAI بموجب ترخيص معهد ماساتشوستس للتكنولوجيا. Dolly 2.0 ، بالإضافة إلى الكود المرتبط به ، متاح بموجب ترخيص MIT. تتمتع Dolly 2.0 بإمكانية تغيير الصناعة وهي خطوة مهمة إلى الأمام للتعلم الآلي.
اقرأ المزيد عن الذكاء الاصطناعي:
إخلاء المسئولية
تتماشى مع المبادئ التوجيهية لمشروع الثقةيرجى ملاحظة أن المعلومات المقدمة في هذه الصفحة ليس المقصود منها ولا ينبغي تفسيرها على أنها نصيحة قانونية أو ضريبية أو استثمارية أو مالية أو أي شكل آخر من أشكال المشورة. من المهم أن تستثمر فقط ما يمكنك تحمل خسارته وأن تطلب مشورة مالية مستقلة إذا كانت لديك أي شكوك. لمزيد من المعلومات، نقترح الرجوع إلى الشروط والأحكام بالإضافة إلى صفحات المساعدة والدعم المقدمة من جهة الإصدار أو المعلن. MetaversePost تلتزم بتقارير دقيقة وغير متحيزة، ولكن ظروف السوق عرضة للتغيير دون إشعار.
نبذة عن الكاتب
دامير هو قائد الفريق ومدير المنتج والمحرر في Metaverse Post، تغطي موضوعات مثل AI / ML و AGI و LLMs و Metaverse و Web3-حقول ذات صله. تجذب مقالاته جمهورًا هائلاً يزيد عن مليون مستخدم كل شهر. يبدو أنه خبير يتمتع بخبرة 10 سنوات في تحسين محركات البحث والتسويق الرقمي. تم ذكر دامير في Mashable، Wired، Cointelegraphو The New Yorker و Inside.com و Entrepreneur و BeInCrypto ومنشورات أخرى. يسافر بين الإمارات العربية المتحدة وتركيا وروسيا ورابطة الدول المستقلة كبدو رقمي. حصل دامير على درجة البكالوريوس في الفيزياء ، والذي يعتقد أنه منحه مهارات التفكير النقدي اللازمة للنجاح في المشهد المتغير باستمرار للإنترنت.
المزيد من المقالاتدامير هو قائد الفريق ومدير المنتج والمحرر في Metaverse Post، تغطي موضوعات مثل AI / ML و AGI و LLMs و Metaverse و Web3-حقول ذات صله. تجذب مقالاته جمهورًا هائلاً يزيد عن مليون مستخدم كل شهر. يبدو أنه خبير يتمتع بخبرة 10 سنوات في تحسين محركات البحث والتسويق الرقمي. تم ذكر دامير في Mashable، Wired، Cointelegraphو The New Yorker و Inside.com و Entrepreneur و BeInCrypto ومنشورات أخرى. يسافر بين الإمارات العربية المتحدة وتركيا وروسيا ورابطة الدول المستقلة كبدو رقمي. حصل دامير على درجة البكالوريوس في الفيزياء ، والذي يعتقد أنه منحه مهارات التفكير النقدي اللازمة للنجاح في المشهد المتغير باستمرار للإنترنت.