Novice Tehnologija
Februar 16, 2026

Qwen uvaja nov model vidnega jezika za izboljšanje kodiranja, sklepanja in delovanja multimodalne umetne inteligence

Na kratko

Ekipa Qwen je predstavila model Qwen3.5‑397B‑A17B z odprto težo, ki uvaja pomemben napredek na področju multimodalne zmogljivosti, učenja z okrepitvijo in učinkovitosti usposabljanja kot del širšega prizadevanja za bolj zmogljive, splošno uporabne agente umetne inteligence.

Qwen uvaja nov model vidnega jezika za izboljšanje kodiranja, sklepanja in delovanja multimodalne umetne inteligence

Ekipa Qwen pri Alibaba Cloudu je predstavila prvi model v svoji novi seriji Qwen3.5, in sicer Qwen3.5‑397B‑A17B z odprto težo. 

Model, ki je pozicioniran kot izvorni sistem vizualnega jezika, zagotavlja visoko zmogljivost pri sklepanju, kodiranju, nalogah agentov in multimodalnem razumevanju, kar odraža pomemben napredek v obsežnih prizadevanjih podjetja za razvoj umetne inteligence. 

Model je zgrajen na hibridni arhitekturi, ki združuje linearno pozornost prek omrežij Gated Delta z zasnovo z redko mešanico strokovnjakov, kar omogoča visoko učinkovitost med sklepanjem. Čeprav celoten sistem vsebuje 397 milijard parametrov, se za vsak prehod naprej aktivira le 17 milijard, kar omogoča ohranjanje visoke zmogljivosti ob hkratnem zmanjšanju računskih stroškov. Izdaja prav tako širi pokritost jezikov in narečij s 119 na 201, kar povečuje dostopnost za uporabnike in razvijalce po vsem svetu.

Qwen3.5 pomeni velik preskok v učinkovitosti učenja z okrepitvijo in predhodnega usposabljanja

Serija Qwen3.5 v primerjavi s Qwen3 prinaša znatne izboljšave, ki jih v veliki meri spodbuja obsežno učenje z okrepitvijo v širokem razponu okolij. Namesto optimizacije za ozke primerjalne vrednosti se je ekipa osredotočila na povečanje težavnosti nalog in posplošljivosti, kar je privedlo do izboljšane učinkovitosti agentov v evalvacijah, kot so BFCL-V4, VITA-Bench, DeepPlanning, Tool-Decathlon in MCP-Mark. Dodatni rezultati bodo podrobneje opisani v prihajajočem tehničnem poročilu.

Izboljšave pred učenjem zajemajo moč, učinkovitost in vsestranskost. Qwen3.5 je usposobljen na bistveno večji količini vizualno-besedilnih podatkov z okrepljeno večjezično, STEM in sklepalno vsebino, kar mu omogoča, da doseže zmogljivost prejšnjih modelov s trilijoni parametrov. Arhitekturne nadgradnje – vključno z MoE z večjo redkostjo, hibridno pozornostjo, izboljšavami stabilnosti in napovedovanjem več žetonov – zagotavljajo veliko povečanje prepustnosti, zlasti pri daljših kontekstnih dolžinah 32k in 256k žetonov. Večmodalne zmogljivosti modela so okrepljene z zgodnjim združevanjem besedil in vida ter razširjenimi nabori podatkov, ki zajemajo slike, STEM gradiva in videoposnetke, medtem ko večji besednjak, dolg 250k, izboljša učinkovitost kodiranja in dekodiranja v večini jezikov.

Infrastruktura, na kateri temelji Qwen3.5, je zasnovana za učinkovito multimodalno učenje. Strategija heterogene vzporednosti ločuje vidne in jezikovne komponente, da se izognemo ozkim grlom, medtem ko redka aktivacija omogoča skoraj polno prepustnost tudi pri mešanih delovnih obremenitvah besedila, slike in videa. Izvorni cevovod FP8 zmanjša aktivacijski pomnilnik za približno polovico in poveča hitrost učenja za več kot 10 odstotkov, s čimer ohranja stabilnost pri velikih količinah žetonov. 

Učenje z okrepitvijo podpira popolnoma asinhrono ogrodje, ki je sposobno obravnavati modele vseh velikosti, izboljšati izkoriščenost strojne opreme, uravnoteženje obremenitve in odpravljanje napak. Tehnike, kot so celovito učenje FP8, spekulativno dekodiranje, ponovno predvajanje usmerjevalnika in večobratno zaklepanje uvajanja, pomagajo ohranjati doslednost in zmanjšati zastarelost gradientov. Sistem je zasnovan za podporo delovnih procesov obsežnih agentov, kar omogoča nemotene večobratne interakcije in široko posplošitev v različnih okoljih.

Uporabniki lahko s Qwen3.5 komunicirajo prek Qwen Chat, ki ponuja načine Auto, Thinking in Fast, odvisno od naloge. Model je na voljo tudi prek Alibaba Cloud ModelStudio, kjer je mogoče z enostavnimi parametri omogočiti napredne funkcije, kot so sklepanje, spletno iskanje in izvajanje kode. Integracija z orodji za kodiranje drugih ponudnikov omogoča razvijalcem, da Qwen3.5 vključijo v obstoječe delovne procese z minimalnimi ovirami.

Po mnenju ekipe Qwen Qwen3.5 s svojo hibridno arhitekturo in izvornim multimodalnim sklepanjem postavlja temelje za univerzalne digitalne agente. Prihodnji razvoj se bo osredotočil na integracijo na sistemski ravni, vključno s trajnim pomnilnikom za učenje med sejami, utelešenimi vmesniki za interakcijo v resničnem svetu, mehanizmi za samostojno izboljševanje in ekonomsko ozaveščenostjo za dolgoročno avtonomno delovanje. Cilj je premakniti se od pomočnikov, specifičnih za naloge, k koherentnim, trajnim agentom, ki so sposobni upravljati kompleksne, večdnevne cilje z zanesljivo, človeku usklajeno presojo.

Zavrnitev odgovornosti

V skladu z Smernice projekta Trust, upoštevajte, da informacije na tej strani niso namenjene in se jih ne sme razlagati kot pravni, davčni, naložbeni, finančni ali kakršen koli drug nasvet. Pomembno je, da vlagate samo tisto, kar si lahko privoščite izgubiti, in da poiščete neodvisen finančni nasvet, če imate kakršne koli dvome. Za dodatne informacije predlagamo, da si ogledate določila in pogoje ter strani s pomočjo in podporo, ki jih nudi izdajatelj ali oglaševalec. MetaversePost se zavzema za natančno in nepristransko poročanje, vendar se tržni pogoji lahko spremenijo brez predhodnega obvestila.

O avtorju

Alisa, predana novinarka pri MPost, je specializirano za kriptovalute, dokazila brez znanja, naložbe in obsežno področje Web3. Z ostrim očesom za nastajajoče trende in tehnologije zagotavlja celovito pokritost za informiranje in vključevanje bralcev v nenehno razvijajočo se pokrajino digitalnih financ.

več člankov
Alisa Davidson
Alisa Davidson

Alisa, predana novinarka pri MPost, je specializirano za kriptovalute, dokazila brez znanja, naložbe in obsežno področje Web3. Z ostrim očesom za nastajajoče trende in tehnologije zagotavlja celovito pokritost za informiranje in vključevanje bralcev v nenehno razvijajočo se pokrajino digitalnih financ.

Hot Stories
Pridružite se našemu glasilu.
Zadnje novice

Zatišje pred nevihto Solana: Kaj zdaj sporočajo grafikoni, kiti in signali na verigi

Solana je pokazala močno uspešnost, ki jo je spodbudilo vse večje sprejemanje, institucionalno zanimanje in ključna partnerstva, hkrati pa se sooča s potencialnimi ...

Več o tem

Kriptovalute aprila 2025: ključni trendi, premiki in kaj sledi

Aprila 2025 se je kripto prostor osredotočil na krepitev osrednje infrastrukture, Ethereum pa se je pripravljal na Pectro ...

Več o tem
Preberi več
Preberi več
Eightco je zbral 125 milijonov dolarjev institucionalnega financiranja, ki ga vodijo Bitmine, ARK Invest in Payward, za pospešitev naložb v tehnologijo naslednje generacije
ŽELITE POSTATI PARTNER Novice Tehnologija
Eightco je zbral 125 milijonov dolarjev institucionalnega financiranja, ki ga vodijo Bitmine, ARK Invest in Payward, za pospešitev naložb v tehnologijo naslednje generacije
Marec 13, 2026
CZ oporeka trditvam Forbesa o neto premoženju; Kako bogati so vodilni kripto glasovi?
ŽELITE POSTATI PARTNER Prisotnost Novice Tehnologija
CZ oporeka trditvam Forbesa o neto premoženju; Kako bogati so vodilni kripto glasovi?
Marec 13, 2026
Od rasti do gotovosti: Pogovor ob kaminu v podjetju HSC Asset Management raziskuje tržne premike in globalni vpliv Kitajske
Hack Seasons Mnenje ŽELITE POSTATI PARTNER Življenjski slog Novice Tehnologija
Od rasti do gotovosti: Pogovor ob kaminu v podjetju HSC Asset Management raziskuje tržne premike in globalni vpliv Kitajske
Marec 13, 2026
Raziskovalec umetne inteligence na Oxfordu Samuele Marro o decentralizirani umetni inteligenci in veriženju blokov: Ko integracija doda vrednost, a omejuje inovacije
Intervju Tehnologija
Raziskovalec umetne inteligence na Oxfordu Samuele Marro o decentralizirani umetni inteligenci in veriženju blokov: Ko integracija doda vrednost, a omejuje inovacije
Marec 13, 2026
CRYPTOMERIA LABS PTE. LTD.