MiniMax M2.1 ponuja napredno večjezično programiranje za kompleksne aplikacije v resničnem svetu
Na kratko
MiniMax, ki ga podpira Alibaba, je izdal M2.1, model z zmogljivimi zmogljivostmi v različnih programskih jezikih ter za razvoj mobilnih in spletnih aplikacij.
Kitajski razvijalec umetne inteligence MiniMax je poročal o izdaji svojega modela M2.1 in ga opisal kot veliko nadgradnjo, zasnovano za zagotavljanje boljše zmogljivosti v več programskih jezikih ter pri razvoju mobilnih in spletnih aplikacij.
Po navedbah podjetja se je prejšnja različica M2 osredotočala predvsem na zmanjšanje obratovalnih stroškov in izboljšanje dostopnosti, medtem ko se izdaja M2.1 osredotoča na izboljšanje učinkovitosti pri kompleksnih nalogah iz resničnega sveta, s posebnim poudarkom na širši jezikovni podpori in praktičnih primerih uporabe v pisarni.
MiniMax je izjavil, da model zdaj ponuja bistveno izboljšane zmogljivosti v širokem naboru programskih jezikov, vključno z Rustom, Javo, Golangom, C++, Kotlinom, Objective-C, TypeScriptom in JavaScriptom, kar omogoča celovit razvoj od nizkonivojskega sistemskega inženiringa do gradnje na aplikacijski plasti. Podjetje je poročalo tudi o večjih izboljšavah pri spletnem in mobilnem razvoju, krepitvi izvorne podpore za Android in iOS, hkrati pa širitvi sposobnosti modela za interpretacijo oblikovalskih zahtev, ustvarjanje vizualno izpopolnjenih vmesnikov ter gradnjo naprednih interaktivnih in tridimenzionalnih simulacijskih okolij.
Podjetje je nadalje poudarilo, da M2.1 izboljšuje obvladovanje kompleksnih naborov ukazov in integrirano izvajanje nalog, kar omogoča zanesljivejše delovanje v scenarijih pisarniške produktivnosti. V primerjavi s predhodnikom je nova različica opisana kot različica, ki zagotavlja krajše in učinkovitejše odzive, hitrejše čase izvajanja in zmanjšane računske stroške, kar prispeva k bolj gladkim delovnim procesom za kodiranje s pomočjo umetne inteligence in operacije, ki temeljijo na agentih. MiniMax je dodal, da M2.1 kaže močno združljivost z različnimi razvojnimi orodji in ogrodji agentov ter zagotavlja izboljšano kakovost pogovorov in pisanja, kar ustvarja podrobnejše in bolje strukturirane rezultate v tehnični dokumentaciji in splošnih komunikacijskih kontekstih.
M2.1 postavlja nova merila učinkovitosti in zagotavlja velike izboljšave pri večjezičnih in celovitih evalvacijah.
MiniMax je poročal, da njegov model M2.1 kaže znatno izboljšanje zmogljivosti v primerjavi s prejšnjo različico M2 v glavnih merilih uspešnosti programskega inženirstva, s še posebej dobrimi rezultati pri večjezičnih programskih nalogah, kjer je opisan kot presežek Claude Sonnet 4.5 in približevanje zmogljivosti Claude Opus 4.5. Podjetje je navedlo, da so ocene, opravljene na SWE-bench Verified z uporabo različnih ogrodij kodnih agentov, pokazale visoko stopnjo posplošitve ogrodja in operativne stabilnosti.
Dodatno primerjalno testiranje, ki zajema področja, kot so generiranje testov, optimizacija izvajalnega okolja, pregled kode in skladnost z navodili, je pokazalo velike izboljšave v primerjavi z M2, pri čemer se je M2.1 v več od teh kategorij dosledno ujemal ali prekašal s Claude Sonnet 4.5. Za oceno sposobnosti modela za načrtovanje in zagotavljanje celovitih aplikacij od začetne zasnove do funkcionalne uvedbe je MiniMax uvedel nov ogrodje za ocenjevanje, imenovano VIBE, ki meri vizualno kakovost in interaktivno vedenje v spletnem, simulacijskem, Android, iOS in zalednem razvoju. Za razliko od tradicionalnih pristopov testiranja VIBE uporablja avtomatizirano metodo preverjanja na osnovi agentov za preučitev tako estetike vmesnika kot logike izvajalnega okolja.
Po podatkih podjetja MiniMax je M2.1 dosegel skupno oceno VIBE 88.6, kar odraža močno zmogljivost razvoja celotnega sklada, s še posebej visokimi rezultati pri spletnem razvoju z 91.5 in razvoju za Android z 89.7. Podjetje je dodalo, da model v primerjavi s prejšnjo izdajo M2 kaže tudi nenehne izboljšave pri razširjeni uporabi orodij in splošnih metrikah inteligence.
Zavrnitev odgovornosti
V skladu z Smernice projekta Trust, upoštevajte, da informacije na tej strani niso namenjene in se jih ne sme razlagati kot pravni, davčni, naložbeni, finančni ali kakršen koli drug nasvet. Pomembno je, da vlagate samo tisto, kar si lahko privoščite izgubiti, in da poiščete neodvisen finančni nasvet, če imate kakršne koli dvome. Za dodatne informacije predlagamo, da si ogledate določila in pogoje ter strani s pomočjo in podporo, ki jih nudi izdajatelj ali oglaševalec. MetaversePost se zavzema za natančno in nepristransko poročanje, vendar se tržni pogoji lahko spremenijo brez predhodnega obvestila.
O avtorju
Alisa, predana novinarka pri MPost, specializiran za kriptovalute, umetno inteligenco, naložbe in široko področje Web3. Z ostrim očesom za nastajajoče trende in tehnologije zagotavlja celovito pokritost za informiranje in vključevanje bralcev v nenehno razvijajočo se pokrajino digitalnih financ.
več člankov
Alisa, predana novinarka pri MPost, specializiran za kriptovalute, umetno inteligenco, naložbe in široko področje Web3. Z ostrim očesom za nastajajoče trende in tehnologije zagotavlja celovito pokritost za informiranje in vključevanje bralcev v nenehno razvijajočo se pokrajino digitalnih financ.



