بازارها گزارش خبری
اوت 08، 2023

علی بابا مدل زبان متن باز Qwen-7B را معرفی می کند

علی بابا از مدل زبان بزرگ (LLM) منبع باز خود به نام خود رونمایی کرد Qwen-7B، نشان دهنده ورود افتتاحیه آنها به قلمرو LLMهای قابل دسترس برای عموم است. این مدل بر روی 7 میلیارد پارامتر ساخته شده است.

علی بابا مدل زبان متن باز Qwen-7B را معرفی می کند

برای زمینه، Qwen-7B با استفاده از 2.2 تریلیون توکن تحت آموزش قرار گرفت. اندازه زمینه تنظیم شده در این مرحله آموزشی 2048 بود، در حالی که کاربران می توانند این اندازه را تا حداکثر 8192 در طول آزمایش افزایش دهند. در مقایسه با، Llama-2، یک LLM دیگر، اندازه زمینه 4096 را ارائه می دهد.

معیارها برای سنجش عملکرد چنین مدل هایی ضروری هستند و در این حوزه، توسعه دهندگان چینی ادعا می کنند که Qwen-7B پیشی گرفته است. Llama-2. یکی از معیارهایی که برجسته است، معیار کدگذاری Human-Eval است که در آن Qwen-7B امتیاز 24.4 را در برابر آن کسب می کند. Llama-2 12.8. با این حال، عاقلانه است که این اعداد را با احتیاط مشاهده کنید. برخی از معیارها نشان می‌دهند که Qwen-7B نه تنها از مدل پایه عملکرد بهتری دارد LLama-2-7B بلکه همچنین LLaMAنوع -2-13B. با این حال، هنگامی که در برابر نسخه های تصفیه شده از Llama-2، حاشیه تفاوت باریکتر می شود. لازم به ذکر است که متدولوژی آموزشی دقیق Qwen-7B به صراحت توسط توسعه دهندگان آن توضیح داده نشده است.

در عملکرد موازی با LLaMa2-chat، Qwen یک نسخه چت محور به نام Qwen-7B-Chat ارائه کرده است. این مدل برای تعامل با کاربران بهینه شده است و ابزارهای مختلف و رابط های برنامه کاربردی برای افزایش پاسخگویی آن

کسانی که تمایل به مشخصات فنی دارند علاقه مند هستند بدانند که شالوده معماری Qwen-7B شبیه به LLaMA. با این حال، ویژگی های متمایزی وجود دارد که Qwen-7B را متمایز می کند:

  1. از تعبیه ناپیدا استفاده می کند.
  2. از تعبیه موقعیتی چرخشی استفاده می شود.
  3. سوگیری ها مستثنی هستند، به استثنای QKV در توجه.
  4. RMSNorm بر LayerNorm ترجیح داده می شود.
  5. به جای ReLU استاندارد، SwiGLU گنجانده شده است.
  6. توجه فلش برای تسریع روند آموزش معرفی شده است.
  7. این مدل از 32 لایه، دارای ابعاد تعبیه شده 4096 است و 32 سر توجه را در خود جای می دهد.

از نظر صدور مجوز، Qwen-7B با Llama-2. اجازه استفاده تجاری را می دهد، اما با ذکر حجم کاربر. در حالی که Llama-2 این سقف را 700 میلیون کاربر فعال در ماه تعیین می کند، آستانه Qwen-7B 100 میلیون است.

کسانی که به دنبال بررسی عمیق هستند می توانند به گزارش فنی موجود در GitHub مراجعه کنند. علاوه بر این، نمایشی از Qwen-7Bکه به زبان چینی ارائه شده است، برای کسانی که علاقه مند به کاوش عملی در مورد قابلیت های مدل هستند قابل دسترسی است.

درباره هوش مصنوعی بیشتر بخوانید:

سلب مسئولیت

در خط با دستورالعمل های پروژه اعتماد، لطفاً توجه داشته باشید که اطلاعات ارائه شده در این صفحه به عنوان مشاوره حقوقی، مالیاتی، سرمایه گذاری، مالی یا هر شکل دیگری در نظر گرفته نشده است و نباید تفسیر شود. مهم است که فقط در موردی سرمایه گذاری کنید که توانایی از دست دادن آن را دارید و در صورت شک و تردید به دنبال مشاوره مالی مستقل باشید. برای کسب اطلاعات بیشتر، پیشنهاد می کنیم به شرایط و ضوابط و همچنین صفحات راهنمایی و پشتیبانی ارائه شده توسط صادرکننده یا تبلیغ کننده مراجعه کنید. MetaversePost متعهد به گزارش دقیق و بی طرفانه است، اما شرایط بازار بدون اطلاع قبلی ممکن است تغییر کند.

درباره نویسنده

Damir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است. 

مقالات بیشتر
دامیر یالالوف
دامیر یالالوف

Damir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است. 

Hot Stories
به خبرنامه ما بپیوندید.
آخرین اخبار

در میان نوسانات، اشتهای سازمانی به سمت ETF های بیت کوین رشد می کند

افشاگری از طریق پرونده های 13F نشان می دهد که سرمایه گذاران نهادی قابل توجهی در ETF های بیت کوین مشغول هستند و بر پذیرش فزاینده ...

بیشتر بدانید

روز صدور حکم فرا می رسد: با بررسی دادگاه ایالات متحده به درخواست وزارت دادگستری، سرنوشت CZ در تعادل است

چانگ پنگ ژائو امروز در دادگاهی در سیاتل آمریکا محکوم خواهد شد.

بیشتر بدانید
به انجمن فناوری نوآورانه ما بپیوندید
ادامه مطلب
ادامه مطلب
Nexo "شکار" را آغاز می کند تا به کاربران با 12 میلیون دلار توکن NEXO برای تعامل با اکوسیستم خود پاداش دهد.
بازارها گزارش خبری پیشرفته
Nexo "شکار" را آغاز می کند تا به کاربران با 12 میلیون دلار توکن NEXO برای تعامل با اکوسیستم خود پاداش دهد.
ممکن است 8، 2024
صرافی Revolut X Revolut، معامله‌گران رمزارز را با هزینه‌های سازنده صفر و تجزیه‌وتحلیل پیشرفته وام می‌کند.
بازارها نرم افزار داستان ها و نقدها پیشرفته
صرافی Revolut X Revolut، معامله‌گران رمزارز را با هزینه‌های سازنده صفر و تجزیه‌وتحلیل پیشرفته وام می‌کند.
ممکن است 8، 2024
پلتفرم تجارت کریپتو BitMEX گزینه های معامله را با 0 کارمزد و مشوق های نقدی آغاز می کند
کسب و کار بازارها گزارش خبری
پلتفرم تجارت کریپتو BitMEX گزینه های معامله را با 0 کارمزد و مشوق های نقدی آغاز می کند
ممکن است 8، 2024
Lisk رسما به لایه 2 اتریوم منتقل می شود و Core نسخه 4.0.6 را معرفی می کند
گزارش خبری پیشرفته
Lisk رسما به لایه 2 اتریوم منتقل می شود و Core نسخه 4.0.6 را معرفی می کند
ممکن است 8، 2024
CRYPTOMERIA LABS PTE. محدود