Qwen Kodlaşdırma, Düşünmə və Multimodal Süni İntellekt Performansını Təkmilləşdirmək üçün Yeni Vizyon Dili Modelini Təqdim Edir
Qısaca
Qwen komandası daha bacarıqlı, ümumi məqsədli süni intellekt agentlərinə doğru daha geniş bir irəliləyişin bir hissəsi olaraq multimodal performans, gücləndirmə təlimi və təlim səmərəliliyi sahələrində əsas irəliləyişlər təqdim edən açıq çəkili Qwen3.5‑397B‑A17B modelini təqdim etdi.
Alibaba Cloud şirkətinin Qwen komandası yeni Qwen3.5 seriyasının ilk modelini təqdim edərək açıq çəkili Qwen3.5‑397B‑A17B-ni təqdim etdi.
Doğma görmə dili sistemi kimi təqdim edilən model, şirkətin genişmiqyaslı süni intellekt inkişaf səylərində əhəmiyyətli bir irəliləyişi əks etdirərək, düşünmə, kodlaşdırma, agent tapşırıqları və multimodal anlaşma sahəsində güclü performans təmin edir.
Model, Gated Delta Networks vasitəsilə xətti diqqəti seyrək mütəxəssislərin qarışığı ilə birləşdirən və nəticə çıxarma zamanı yüksək səmərəliliyi təmin edən hibrid arxitektura üzərində qurulub. Bütün sistem 397 milyard parametr ehtiva etsə də, hər irəli ötürmə üçün yalnız 17 milyard parametr aktivləşdirilir ki, bu da hesablama xərclərini azaltmaqla yanaşı yüksək qabiliyyəti qorumağa imkan verir. Buraxılış həmçinin dil və dialekt əhatə dairəsini 119-dan 201-ə qədər genişləndirir və dünya üzrə istifadəçilər və inkişaf etdiricilər üçün əlçatanlığı genişləndirir.
Qwen3.5 Gücləndirmə Öyrənməsində və Əvvəlcədən Təlim Səmərəliliyində Böyük Bir Sıçrayışa imza atır
Qwen3.5 seriyası, əsasən geniş mühitlərdə gücləndirmə təliminin geniş miqyaslanması ilə Qwen3 üzərində əhəmiyyətli irəliləyişlər təqdim edir. Komanda dar etalonlar üçün optimallaşdırma aparmaq əvəzinə, tapşırıq çətinliyini və ümumiləşdirilə bilmə qabiliyyətini artırmağa diqqət yetirdi və nəticədə BFCL‑V4, VITA‑Bench, DeepPlanning, Tool‑Decathlon və MCP‑Mark kimi qiymətləndirmələrdə agent performansı yaxşılaşdı. Əlavə nəticələr qarşıdakı texniki hesabatda ətraflı şəkildə təqdim olunacaq.
Əvvəlcədən təlim təkmilləşdirmələri güc, səmərəlilik və çox yönlülüyü əhatə edir. Qwen3.5, gücləndirilmiş çoxdilli, STEM və düşünmə məzmunu ilə əhəmiyyətli dərəcədə daha böyük həcmdə vizual mətn məlumatları üzərində təlim keçir və bu da onun əvvəlki trilyon parametrli modellərin performansına uyğunlaşmasına imkan verir. Daha yüksək seyrəklik MoE, hibrid diqqət, sabitlik təkmilləşdirmələri və çoxtoken proqnozlaşdırması da daxil olmaqla memarlıq yeniləmələri, xüsusən də 32k və 256k tokenlərin genişləndirilmiş kontekst uzunluqlarında əsas ötürmə qabiliyyəti qazandırır. Modelin multimodal imkanları erkən mətn görmə birləşməsi və şəkilləri, STEM materialları və videonu əhatə edən genişləndirilmiş məlumat dəstləri vasitəsilə gücləndirilir, daha böyük 250k lüğət isə əksər dillərdə kodlaşdırma və dekodlaşdırma səmərəliliyini artırır.
Qwen3.5-in arxasındakı infrastruktur səmərəli multimodal təlim üçün nəzərdə tutulub. Heterogen paralellik strategiyası maneələrin qarşısını almaq üçün görmə və dil komponentlərini ayırır, seyrək aktivləşdirmə isə qarışıq mətn-şəkil-video iş yüklərində belə demək olar ki, tam ötürmə qabiliyyətinə imkan verir. Yerli FP8 boru kəməri aktivləşdirmə yaddaşını təxminən yarıya qədər azaldır və təlim sürətini 10 faizdən çox artırır, kütləvi token miqyaslarında sabitliyi qoruyur.
Gücləndirmə təlimi, bütün ölçülü modelləri idarə edə bilən, aparat istifadəsini təkmilləşdirən, yük balansını və xətaların aradan qaldırılmasını təmin edən tam asinxron bir çərçivə tərəfindən dəstəklənir. FP8 başdan-ayağa təlim, spekulyativ dekodlaşdırma, routerin təkrarlanması və çoxnövbəli yayım kilidləməsi kimi üsullar ardıcıllığı qorumağa və qradiyent köhnəlməsini azaltmağa kömək edir. Sistem, genişmiqyaslı agent iş axınlarını dəstəkləmək üçün qurulmuşdur ki, bu da sorunsuz çoxnövbəli qarşılıqlı əlaqələri və mühitlər arasında geniş ümumiləşdirməni təmin edir.
İstifadəçilər Qwen3.5 ilə tapşırıqdan asılı olaraq Avtomatik, Düşünmə və Sürətli rejimlər təklif edən Qwen Chat vasitəsilə qarşılıqlı əlaqə qura bilərlər. Model həmçinin Alibaba Cloud-un ModelStudio vasitəsilə də mövcuddur, burada sadə parametrlər vasitəsilə düşünmə, veb axtarışı və kod icrası kimi qabaqcıl xüsusiyyətlərin aktivləşdirilə biləcəyi. Üçüncü tərəf kodlaşdırma alətləri ilə inteqrasiya, tərtibatçılara Qwen3.5-i mövcud iş axınlarına minimal sürtünmə ilə tətbiq etməyə imkan verir.
Qwen komandasına görə, Qwen3.5 hibrid arxitekturası və yerli multimodal düşüncə tərzi vasitəsilə universal rəqəmsal agentlər üçün təməl yaradır. Gələcək inkişaf sistem səviyyəli inteqrasiyaya, o cümlədən sessiyalararası öyrənmə üçün davamlı yaddaşa, real dünya qarşılıqlı əlaqəsi üçün təcəssüm olunmuş interfeyslərə, özünə yönəlmiş təkmilləşdirmə mexanizmlərinə və uzunmüddətli muxtar əməliyyat üçün iqtisadi məlumatlılığa yönələcək. Məqsəd, tapşırıqlara xas köməkçilərdən kənara çıxaraq, mürəkkəb, çoxgünlük məqsədləri etibarlı, insanla uyğunlaşdırılmış mühakimə ilə idarə edə bilən ardıcıl, davamlı agentlərə doğru irəliləməkdir.
Məsuliyyətdən imtina
uyğun olaraq Güvən Layihəsi qaydaları, lütfən nəzərə alın ki, bu səhifədə təqdim olunan məlumat hüquqi, vergi, investisiya, maliyyə və ya hər hansı digər məsləhət forması kimi təfsir edilməməlidir və təfsir edilməməlidir. Yalnız itirə biləcəyiniz şeyə investisiya qoymaq və hər hansı bir şübhəniz varsa, müstəqil maliyyə məsləhətləri axtarmaq vacibdir. Əlavə məlumat üçün biz emitent və ya reklamçı tərəfindən təmin edilən şərtlər və şərtlərə, həmçinin yardım və dəstək səhifələrinə müraciət etməyi təklif edirik. MetaversePost dəqiq, qərəzsiz hesabat verməyə sadiqdir, lakin bazar şərtləri xəbərdarlıq edilmədən dəyişdirilə bilər.
Müəllif haqqında
Alisa, xüsusi jurnalist MPost, kriptovalyuta, sıfır bilik sübutları, investisiyalar və geniş səltənət sahəsində ixtisaslaşmışdır. Web3. Yaranan tendensiyaları və texnologiyaları diqqətlə izləyərək, o, oxucuları məlumatlandırmaq və rəqəmsal maliyyənin daim inkişaf edən mənzərəsinə cəlb etmək üçün hərtərəfli əhatə dairəsi təqdim edir.
Ətraflı məqalələr
Alisa, xüsusi jurnalist MPost, kriptovalyuta, sıfır bilik sübutları, investisiyalar və geniş səltənət sahəsində ixtisaslaşmışdır. Web3. Yaranan tendensiyaları və texnologiyaları diqqətlə izləyərək, o, oxucuları məlumatlandırmaq və rəqəmsal maliyyənin daim inkişaf edən mənzərəsinə cəlb etmək üçün hərtərəfli əhatə dairəsi təqdim edir.