Qwen kodlash, mulohaza yuritish va multimodal sun'iy intellekt samaradorligini oshirish uchun yangi ko'rish tili modelini taqdim etadi
Qisqacha
Qwen jamoasi ochiq vaznli Qwen3.5‑397B‑A17B modelini ishga tushirdi va yanada qobiliyatli, umumiy maqsadli sun'iy intellekt agentlariga kengroq intilish doirasida multimodal ishlash, mustahkamlash bo'yicha o'qitish va o'qitish samaradorligida katta yutuqlarni taqdim etdi.
Alibaba Cloud’ning Qwen jamoasi o‘zining yangi Qwen3.5 seriyasidagi birinchi modelni taqdim etdi va ochiq vaznli Qwen3.5‑397B‑A17B ni namoyish etdi.
Mahalliy ko'rish tili tizimi sifatida joylashtirilgan ushbu model fikrlash, kodlash, agent vazifalari va multimodal tushunish bo'yicha yuqori samaradorlikni ta'minlaydi, bu kompaniyaning keng ko'lamli AIni rivojlantirishdagi sa'y-harakatlarida sezilarli yutuqlarni aks ettiradi.
Model Gated Delta Networks orqali chiziqli e'tiborni mutaxassislarning siyrak aralashmasi bilan birlashtirgan gibrid arxitektura asosida qurilgan bo'lib, bu xulosa chiqarish paytida yuqori samaradorlikni ta'minlaydi. To'liq tizim 397 milliard parametrni o'z ichiga olsa-da, har bir oldinga o'tish uchun atigi 17 milliard parametr faollashtiriladi, bu esa hisoblash xarajatlarini kamaytirish bilan birga yuqori imkoniyatlarni saqlab qolish imkonini beradi. Ushbu nashr shuningdek, til va lahjalar qamrovini 119 dan 201 gacha kengaytiradi, bu esa butun dunyo bo'ylab foydalanuvchilar va ishlab chiquvchilar uchun kirish imkoniyatini kengaytiradi.
Qwen3.5 mustahkamlovchi o'rganish va mashg'ulotlardan oldingi samaradorlikda katta sakrashni amalga oshirdi
Qwen3.5 seriyasi Qwen3 ga nisbatan sezilarli yutuqlarni taqdim etadi, bu asosan keng ko'lamli muhitlarda mustahkamlash bo'yicha o'rganishni kengaytirish bilan bog'liq. Tor mezonlar uchun optimallashtirish o'rniga, jamoa vazifalarning qiyinligi va umumlashtirilishini oshirishga e'tibor qaratdi, natijada BFCL‑V4, VITA‑Bench, DeepPlanning, Tool‑Decathlon va MCP‑Mark kabi baholashlarda agentlarning ishlashi yaxshilandi. Qo'shimcha natijalar kelgusi texnik hisobotda batafsil bayon qilinadi.
Dastlabki o'qitish yaxshilanishlari kuch, samaradorlik va ko'p qirralilikni qamrab oladi. Qwen3.5 ko'p tilli, STEM va mulohaza yuritish mazmunini kuchaytirish bilan vizual matn ma'lumotlarining sezilarli darajada katta hajmiga o'rgatilgan bo'lib, bu unga avvalgi trillion parametrli modellarning ishlashiga mos kelish imkonini beradi. Arxitektura yangilanishlari, jumladan, yuqori siyraklikdagi MoE, gibrid e'tibor, barqarorlikni takomillashtirish va ko'p tokenli bashorat qilish, ayniqsa 32k va 256k tokenlarning kengaytirilgan kontekst uzunliklarida katta o'tkazish qobiliyatini oshiradi. Modelning multimodal imkoniyatlari dastlabki matnni ko'rish birlashishi va tasvirlar, STEM materiallari va videolarni qamrab oluvchi kengaytirilgan ma'lumotlar to'plamlari orqali mustahkamlanadi, 250k dan kattaroq lug'at esa ko'pgina tillarda kodlash va dekodlash samaradorligini oshiradi.
Qwen3.5 ortidagi infratuzilma samarali multimodal mashg'ulotlar uchun mo'ljallangan. Turli xil parallelizm strategiyasi to'siqlarning oldini olish uchun ko'rish va til komponentlarini ajratadi, siyrak faollashtirish esa aralash matn-tasvir-video ish yuklamalarida ham deyarli to'liq o'tkazish qobiliyatini ta'minlaydi. Mahalliy FP8 quvur liniyasi faollashtirish xotirasini taxminan ikki baravar kamaytiradi va mashg'ulot tezligini 10 foizdan ko'proqqa oshiradi, bu esa ulkan token miqyosida barqarorlikni saqlaydi.
Mustahkamlash bo'yicha o'qitish barcha o'lchamdagi modellarni boshqarish, apparatdan foydalanishni yaxshilash, yuklarni muvozanatlash va nosozliklarni bartaraf etishga qodir to'liq asinxron tizim tomonidan qo'llab-quvvatlanadi. FP8 boshidan oxirigacha o'qitish, spekulyativ dekodlash, yo'riqnoma qayta ijro etish va ko'p burilishli yo'riqnoma qulflash kabi usullar izchillikni saqlashga va gradientning eskirganligini kamaytirishga yordam beradi. Tizim keng ko'lamli agent ish oqimlarini qo'llab-quvvatlash uchun yaratilgan bo'lib, uzluksiz ko'p burilishli o'zaro ta'sirlar va muhitlar bo'ylab keng umumlashtirishni ta'minlaydi.
Foydalanuvchilar Qwen3.5 bilan vazifaga qarab Avtomatik, Fikrlash va Tez rejimlarni taklif qiluvchi Qwen Chat orqali o'zaro aloqada bo'lishlari mumkin. Model shuningdek, Alibaba Cloud’ning ModelStudio’si orqali ham mavjud bo'lib, u yerda mulohaza yuritish, veb-qidiruv va kodni bajarish kabi ilg'or funksiyalarni oddiy parametrlar orqali yoqish mumkin. Uchinchi tomon kodlash vositalari bilan integratsiya ishlab chiquvchilarga Qwen3.5 ni mavjud ish oqimlariga minimal ishqalanish bilan qo'llash imkonini beradi.
Qwen jamoasining fikriga ko'ra, Qwen3.5 o'zining gibrid arxitekturasi va mahalliy multimodal fikrlash orqali universal raqamli agentlar uchun poydevor yaratadi. Kelajakdagi rivojlanish tizim darajasidagi integratsiyaga, jumladan, sessiyalararo o'rganish uchun doimiy xotiraga, real dunyo o'zaro ta'siri uchun implementatsiyalangan interfeyslarga, o'z-o'zini boshqarish mexanizmlariga va uzoq muddatli avtonom ishlash uchun iqtisodiy xabardorlikka qaratiladi. Maqsad vazifaga xos yordamchilardan tashqari, murakkab, ko'p kunlik maqsadlarni ishonchli, insoniy fikrlash bilan boshqarishga qodir izchil, doimiy agentlarga o'tishdir.
Masʼuliyatdan voz kechish
Bunga javoban Ishonch loyihasi bo'yicha ko'rsatmalar, iltimos, ushbu sahifada taqdim etilgan ma'lumotlar yuridik, soliq, investitsiya, moliyaviy yoki boshqa har qanday maslahat shakli sifatida talqin qilinmasligi va talqin qilinmasligini unutmang. Faqat yo'qotishingiz mumkin bo'lgan narsaga investitsiya qilish va agar shubhangiz bo'lsa, mustaqil moliyaviy maslahat olish muhimdir. Qo'shimcha ma'lumot olish uchun biz shartlar va emitent yoki reklama beruvchi tomonidan taqdim etilgan yordam va qo'llab-quvvatlash sahifalariga murojaat qilishni tavsiya qilamiz. MetaversePost to'g'ri, xolis hisobot berish majburiyatini oladi, lekin bozor sharoitlari ogohlantirilmasdan o'zgarishi mumkin.
Muallif haqida
Alisa, ixtisoslashgan jurnalist MPost, kriptovalyuta, nol bilim dalillari, investitsiyalar va keng qamrovli sohaga ixtisoslashgan. Web3. Rivojlanayotgan tendentsiyalar va texnologiyalarni diqqat bilan kuzatib, u o'quvchilarni raqamli moliyaning doimiy rivojlanayotgan manzarasi haqida xabardor qilish va jalb qilish uchun keng qamrovli yoritishni taqdim etadi.
Boshqa maqolalar
Alisa, ixtisoslashgan jurnalist MPost, kriptovalyuta, nol bilim dalillari, investitsiyalar va keng qamrovli sohaga ixtisoslashgan. Web3. Rivojlanayotgan tendentsiyalar va texnologiyalarni diqqat bilan kuzatib, u o'quvchilarni raqamli moliyaning doimiy rivojlanayotgan manzarasi haqida xabardor qilish va jalb qilish uchun keng qamrovli yoritishni taqdim etadi.