turud Uudiste reportaaž
August 08, 2023

Alibaba tutvustab avatud lähtekoodiga Qwen-7B keelemudelit

Alibaba avalikustas oma avatud lähtekoodiga suure keelemudeli (LLM). Qwen-7B, mis tähistab nende avalikku sisenemist avalikult juurdepääsetavate LLM-ide valdkonda. See mudel on üles ehitatud 7 miljardile parameetrile.

Alibaba tutvustab avatud lähtekoodiga Qwen-7B keelemudelit

Konteksti jaoks läbis Qwen-7B koolituse 2.2 triljoni žetooniga. Selle koolitusetapi ajal määratud konteksti suurus oli 2048, samas kui kasutajad saavad seda testimise ajal pikendada maksimaalselt 8192-ni. Võrdluseks, Llama-2, teine ​​LLM, pakub konteksti suurust 4096.

Võrdlusalused on selliste mudelite jõudluse mõõtmiseks hädavajalikud ja selles valdkonnas väidavad Hiina arendajad, et Qwen-7B on ületanud Llama-2. Üks silmapaistev mõõdik on Human-Evali kodeerimise võrdlusalus, kus Qwen-7B tulemus on 24.4. Llama-2 12.8. Siiski on mõistlik vaadata neid numbreid teatud ettevaatusega. Mõned võrdlusnäitajad näitavad, et Qwen-7B ei ületa mitte ainult baasmudelit LLama-2-7B vaid ka LLaMA-2-13B variant. Kui aga võrrelda seda rafineeritud versioonidega Llama-2, muutub erinevuse piir kitsamaks. Tuleb märkida, et Qwen-7B täpset koolitusmetoodikat ei ole selle arendajad selgesõnaliselt kirjeldanud.

Funktsionaalsuses paralleelselt LLaMa2-vestluses on Qwen esitanud vestluskeskse versiooni nimega Qwen-7B-Chat. See mudel on optimeeritud kasutajatega suhtlemiseks ning sisaldab erinevaid tööriistu ja API-liidesed selle reageerimisvõime suurendamiseks.

Need, kes kalduvad tehniliste eripärade poole, oleksid huvitatud sellest, et Qwen-7B arhitektuurne vundament sarnaneb LLaMA. Siiski on Qwen-7B-d eristavad erinevad omadused:

  1. See kasutab lahtiühendatud manustamist.
  2. Kasutatakse pöördpositsioonilist kinnistamist.
  3. Eelarvamused on välistatud, välja arvatud QKV tähelepanu osas.
  4. RMSNorm on eelistatud LayerNormile.
  5. Standardse ReLU asemel on kaasatud SwiGLU.
  6. Treeningprotsessi kiirendamiseks on kasutusele võetud välktähelepanu.
  7. Mudel koosneb 32 kihist, selle manustamismõõde on 4096 ja see mahutab 32 tähelepanupead.

Litsentsimise osas ühtib Qwen-7B Llama-2. See lubab kommertskasutust, kuid tingimusel on kasutajate maht. Kuigi Llama-2 seab selle ülemmäära 700 miljonile aktiivsele kasutajale kuus, Qwen-7B lävi on 100 miljonit.

Need, kes soovivad põhjalikku uurimist, võivad tutvuda GitHubis saadaoleva tehnilise aruandega. Lisaks Qwen-7B demonstratsioon, mis on esitatud hiina keeles, on kättesaadav neile, kes on huvitatud mudeli võimaluste praktilisest uurimisest.

Loe AI kohta lähemalt:

Kaebused

Vastavalt Usaldusprojekti juhised, pange tähele, et sellel lehel esitatud teave ei ole mõeldud ega tohiks tõlgendada kui juriidilist, maksu-, investeerimis-, finants- või muud nõuannet. Oluline on investeerida ainult seda, mida saate endale lubada kaotada, ja kahtluste korral küsida sõltumatut finantsnõu. Lisateabe saamiseks soovitame vaadata nõudeid ja tingimusi ning väljaandja või reklaamija pakutavaid abi- ja tugilehti. MetaversePost on pühendunud täpsele ja erapooletule aruandlusele, kuid turutingimusi võidakse ette teatamata muuta.

Umbes Autor

Damir on ettevõtte meeskonnajuht, tootejuht ja toimetaja Metaverse Post, mis hõlmab selliseid teemasid nagu AI/ML, AGI, LLM-id, Metaverse ja Web3-seotud väljad. Tema artiklid meelitavad igal kuul tohutut vaatajaskonda, üle miljoni kasutaja. Ta näib olevat ekspert, kellel on 10-aastane SEO ja digitaalse turunduse kogemus. Damirit on mainitud ajakirjades Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muud väljaanded. Ta reisib digitaalse nomaadina AÜE, Türgi, Venemaa ja SRÜ vahel. Damir omandas bakalaureusekraadi füüsikas, mis on tema arvates andnud talle kriitilise mõtlemise oskused, mida on vaja pidevalt muutuval Interneti-maastikul edukaks saamiseks. 

Veel artikleid
Damir Jalalov
Damir Jalalov

Damir on ettevõtte meeskonnajuht, tootejuht ja toimetaja Metaverse Post, mis hõlmab selliseid teemasid nagu AI/ML, AGI, LLM-id, Metaverse ja Web3-seotud väljad. Tema artiklid meelitavad igal kuul tohutut vaatajaskonda, üle miljoni kasutaja. Ta näib olevat ekspert, kellel on 10-aastane SEO ja digitaalse turunduse kogemus. Damirit on mainitud ajakirjades Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muud väljaanded. Ta reisib digitaalse nomaadina AÜE, Türgi, Venemaa ja SRÜ vahel. Damir omandas bakalaureusekraadi füüsikas, mis on tema arvates andnud talle kriitilise mõtlemise oskused, mida on vaja pidevalt muutuval Interneti-maastikul edukaks saamiseks. 

Hot Stories

Avastage krüptovaalad: kes on kes turul

by Viktoriia Palchik
Võib 07 2024
Liituge meie uudiskirjaga.
Uudised

Institutsionaalne isu kasvab volatiilsuse tõttu Bitcoini ETF-ide poole

13F-i dokumentide kaudu avaldatud teave paljastab märkimisväärsed institutsionaalsed investorid, kes tegelevad Bitcoini ETF-idega, rõhutades, et ...

Rohkem teada

Karistuspäev saabub: CZ saatus on tasakaalus, kuna USA kohus võtab DOJ palvet arvesse

Changpeng Zhao ootab täna ees kohtuotsus USA Seattle'i kohtus.

Rohkem teada
Liituge meie uuendusliku tehnikakogukonnaga
Loe rohkem
Loe edasi
Wall Streeti meemide sees (WSM): pealkirjade avalikustamine
Äri turud Lood ja ülevaated Tehnoloogia
Wall Streeti meemide sees (WSM): pealkirjade avalikustamine
Võib 7 2024
Avastage krüptovaalad: kes on kes turul
Äri turud Lood ja ülevaated Tehnoloogia
Avastage krüptovaalad: kes on kes turul
Võib 7 2024
Orbiter Finance partnerid Bitcoin Layer 2 Zulu võrguga ja juurutavad on Lwazi Testnet
Äri Uudiste reportaaž Tehnoloogia
Orbiter Finance partnerid Bitcoin Layer 2 Zulu võrguga ja juurutavad on Lwazi Testnet 
Võib 7 2024
Krüptovahetuse bybit integreerib Ethena Labsi USDe tagatisvarana, võimaldab BTC-USDe ja ETH-USDe kauplemispaare
turud Uudiste reportaaž Tehnoloogia
Krüptovahetuse bybit integreerib Ethena Labsi USDe tagatisvarana, võimaldab BTC-USDe ja ETH-USDe kauplemispaare
Võib 7 2024
CRYPTOMERIA LABS PTE. LTD.