الأسواق تقرير الأخبار
08 أغسطس 2023

تقدم Alibaba نموذج لغة Qwen-7B مفتوح المصدر

كشفت Alibaba النقاب عن نموذج اللغة الكبيرة مفتوح المصدر (LLM) المسمى كوين-7ب، بمناسبة دخولهم الافتتاحي إلى عالم LLMs التي يمكن الوصول إليها بشكل عام. تم بناء هذا النموذج على 7 مليار معلمة.

تقدم Alibaba نموذج لغة Qwen-7B مفتوح المصدر

للسياق، خضع Qwen-7B للتدريب باستخدام 2.2 تريليون رمز. كان حجم السياق الذي تم تعيينه خلال مرحلة التدريب هذه هو 2048، بينما يمكن للمستخدمين توسيع هذا إلى حد أقصى يبلغ 8192 أثناء الاختبار. بالمقارنة، Llama-2، وهو LLM آخر، يقدم حجم سياق يبلغ 4096.

تعتبر المعايير المعيارية ضرورية لقياس أداء مثل هذه النماذج، وفي هذا المجال يؤكد المطورون الصينيون أن Qwen-7B قد تفوق على Llama-2. أحد المقاييس البارزة هو معيار ترميز Human-Eval، حيث حصل Qwen-7B على 24.4 نقطة مقابل Llama-2 12.8. ومع ذلك، فمن الحكمة النظر إلى هذه الأرقام بدرجة من الحذر. تشير بعض المعايير إلى أن Qwen-7B يتفوق ليس فقط على النموذج الأساسي لـ LLama-2-7B ولكن أيضًا LLaMA-2-13B البديل. ومع ذلك، عندما يتم مقارنتها بالإصدارات المكررة من Llama-2 يصبح هامش الاختلاف أضيق. تجدر الإشارة إلى أن منهجية التدريب الدقيقة لـ Qwen-7B لم يتم تفصيلها بشكل واضح من قبل مطوريها.

في وظائف موازية ل LLaMa2-chat، قدمت Qwen نسخة تتمحور حول الدردشة باسم Qwen-7B-Chat. تم تحسين هذا النموذج للتفاعل مع المستخدمين ويتضمن أدوات وميزات متنوعة واجهات برمجة التطبيقات لتعزيز استجابتها.

سيكون أولئك الذين لديهم ميل نحو التفاصيل الفنية مهتمين بمعرفة أن الأساس المعماري لـ Qwen-7B يشبه LLaMA. ومع ذلك، هناك ميزات مميزة تميز Qwen-7B:

  1. يستخدم التضمين غير المقيد.
  2. يتم استخدام التضمين الموضعي الدوراني.
  3. يتم استبعاد التحيزات ، باستثناء QKV في الانتباه.
  4. يفضل RMSNorm على LayerNorm.
  5. بدلاً من ReLU القياسي ، تم دمج SwiGLU.
  6. تم تقديم الاهتمام السريع لتسريع عملية التدريب.
  7. يتكون النموذج من 32 طبقة ، وبُعد تضمين 4096 ، ويتسع لـ 32 رأس انتباه.

فيما يتعلق بالترخيص، يتوافق Qwen-7B مع Llama-2. فهو يسمح بالاستخدام التجاري، ولكن مع اشتراط حجم المستخدم. بينما Llama-2 يحدد هذا الحد الأقصى عند 700 مليون مستخدم نشط شهريًا، وعتبة Qwen-7B هي 100 مليون.

يمكن لأولئك الذين يسعون لإجراء فحص متعمق الرجوع إلى التقرير الفني المتاح على GitHub. بالإضافة إلى ذلك، مظاهرة Qwen-7B، المقدمة باللغة الصينية ، يمكن الوصول إليها للمهتمين بالاستكشاف العملي لقدرات النموذج.

اقرأ المزيد عن الذكاء الاصطناعي:

إخلاء المسئولية

تتماشى مع المبادئ التوجيهية لمشروع الثقةيرجى ملاحظة أن المعلومات المقدمة في هذه الصفحة ليس المقصود منها ولا ينبغي تفسيرها على أنها نصيحة قانونية أو ضريبية أو استثمارية أو مالية أو أي شكل آخر من أشكال المشورة. من المهم أن تستثمر فقط ما يمكنك تحمل خسارته وأن تطلب مشورة مالية مستقلة إذا كانت لديك أي شكوك. لمزيد من المعلومات، نقترح الرجوع إلى الشروط والأحكام بالإضافة إلى صفحات المساعدة والدعم المقدمة من جهة الإصدار أو المعلن. MetaversePost تلتزم بتقارير دقيقة وغير متحيزة، ولكن ظروف السوق عرضة للتغيير دون إشعار.

نبذة عن الكاتب

دامير هو قائد الفريق ومدير المنتج والمحرر في Metaverse Post، تغطي موضوعات مثل AI / ML و AGI و LLMs و Metaverse و Web3-حقول ذات صله. تجذب مقالاته جمهورًا هائلاً يزيد عن مليون مستخدم كل شهر. يبدو أنه خبير يتمتع بخبرة 10 سنوات في تحسين محركات البحث والتسويق الرقمي. تم ذكر دامير في Mashable، Wired، Cointelegraphو The New Yorker و Inside.com و Entrepreneur و BeInCrypto ومنشورات أخرى. يسافر بين الإمارات العربية المتحدة وتركيا وروسيا ورابطة الدول المستقلة كبدو رقمي. حصل دامير على درجة البكالوريوس في الفيزياء ، والذي يعتقد أنه منحه مهارات التفكير النقدي اللازمة للنجاح في المشهد المتغير باستمرار للإنترنت. 

المزيد من المقالات
دامير يالالوف
دامير يالالوف

دامير هو قائد الفريق ومدير المنتج والمحرر في Metaverse Post، تغطي موضوعات مثل AI / ML و AGI و LLMs و Metaverse و Web3-حقول ذات صله. تجذب مقالاته جمهورًا هائلاً يزيد عن مليون مستخدم كل شهر. يبدو أنه خبير يتمتع بخبرة 10 سنوات في تحسين محركات البحث والتسويق الرقمي. تم ذكر دامير في Mashable، Wired، Cointelegraphو The New Yorker و Inside.com و Entrepreneur و BeInCrypto ومنشورات أخرى. يسافر بين الإمارات العربية المتحدة وتركيا وروسيا ورابطة الدول المستقلة كبدو رقمي. حصل دامير على درجة البكالوريوس في الفيزياء ، والذي يعتقد أنه منحه مهارات التفكير النقدي اللازمة للنجاح في المشهد المتغير باستمرار للإنترنت. 

Hot Stories
اشترك في صحيفتنا الإخبارية.
آخـر الأخبار

تنمو الشهية المؤسسية تجاه صناديق الاستثمار المتداولة في البيتكوين وسط التقلبات

تكشف الإفصاحات من خلال ملفات 13F عن مستثمرين مؤسسيين بارزين يشتغلون بصناديق الاستثمار المتداولة في البيتكوين، مما يؤكد القبول المتزايد لـ ...

لمعرفة المزيد

وصول يوم النطق بالحكم: مصير تشيكوسلوفاكيا معلق في الميزان بينما تنظر المحكمة الأمريكية في التماس وزارة العدل

ومن المقرر أن يواجه Changpeng Zhao الحكم في محكمة أمريكية في سياتل اليوم.

لمعرفة المزيد
انضم إلى مجتمعنا التقني المبتكر
تفاصيل أكثر
المزيد
اكتشف الحيتان المشفرة: من هو الموجود في السوق
باقة الأعمال الأسواق قصص ومراجعات تكنولوجيا
اكتشف الحيتان المشفرة: من هو الموجود في السوق
7 مايو 2024
شركاء Orbiter Finance مع شبكة Bitcoin Layer 2 Zulu ويتم نشرها على Lwazi Testnet
باقة الأعمال تقرير الأخبار تكنولوجيا
شركاء Orbiter Finance مع شبكة Bitcoin Layer 2 Zulu ويتم نشرها على Lwazi Testnet 
7 مايو 2024
تقوم بورصة العملات المشفرة Bybit بدمج USDe الخاص بشركة Ethena Labs كأصل إضافي، مما يتيح أزواج تداول BTC-USDe وETH-USDe
الأسواق تقرير الأخبار تكنولوجيا
تقوم بورصة العملات المشفرة Bybit بدمج USDe الخاص بشركة Ethena Labs كأصل إضافي، مما يتيح أزواج تداول BTC-USDe وETH-USDe
7 مايو 2024
تقدم Bitget Wallet برنامج GetDrop Airdrop المنصة وتطلق أول حدث لعملة Meme مع مجموع جوائز قدره 130,000 دولار أمريكي
الأسواق تقرير الأخبار تكنولوجيا
تقدم Bitget Wallet برنامج GetDrop Airdrop المنصة وتطلق أول حدث لعملة Meme مع مجموع جوائز قدره 130,000 دولار أمريكي
7 مايو 2024
CRYPTOMERIA LABS PTE. المحدودة.