piacok Tudósítást
08. augusztus 2023.

Az Alibaba bemutatja a nyílt forráskódú Qwen-7B nyelvi modellt

Az Alibaba bemutatta nyílt forráskódú Large Language Model-jét (LLM). Qwen-7B, jelezve első lépésüket a nyilvánosan elérhető LLM-ek birodalmába. Ez a modell 7 milliárd paraméterre épül.

Az Alibaba bemutatja a nyílt forráskódú Qwen-7B nyelvi modellt

A környezet szempontjából a Qwen-7B 2.2 billió token felhasználásával végzett kiképzésen. Az ebben a képzési szakaszban beállított kontextusméret 2048 volt, míg a felhasználók ezt a tesztelés során maximum 8192-re bővíthetik. Összehasonlítva, Llama-2, egy másik LLM, 4096-os környezetméretet kínál.

A benchmarkok elengedhetetlenek az ilyen modellek teljesítményének felméréséhez, és ezen a területen a kínai fejlesztők azt állítják, hogy a Qwen-7B felülmúlta Llama-2. Az egyik kiemelkedő mutató a Human-Eval kódolási benchmark, ahol a Qwen-7B pontszáma 24.4 Llama-2-es 12.8. Érdemes azonban ezeket a számokat bizonyos fokú óvatossággal szemlélni. Egyes benchmarkok azt mutatják, hogy a Qwen-7B nem csak az alapmodellnél jobb teljesítményt nyújt LLama-2-7B hanem a LLaMA-2-13B változat. Azonban, ha szembeállítjuk a finomított változataival Llama-2, a különbségi határ szűkül. Meg kell jegyezni, hogy a Qwen-7B pontos edzésmódszerét a fejlesztők nem részletezték kifejezetten.

A funkcióval párhuzamosan LLaMaA 2-chat, a Qwen bemutatta a Qwen-7B-Chat csevegésközpontú változatát. Ez a modell a felhasználókkal való interakcióra lett optimalizálva, és különféle eszközöket és eszközöket tartalmaz API-k reagálóképességének fokozására.

A műszaki sajátosságok iránt érdeklődőket érdekelné, hogy a Qwen-7B építészeti alapja hasonlít a LLaMA. Vannak azonban olyan jellegzetességek, amelyek megkülönböztetik a Qwen-7B-t:

  1. Kötetlen beágyazást alkalmaz.
  2. Rotációs pozicionális beágyazást alkalmaznak.
  3. A torzítások kizárva, a QKV kivételével a figyelemben.
  4. Az RMSNorm előnyben részesített a LayerNorm helyett.
  5. A szabványos ReLU helyett a SwiGLU került beépítésre.
  6. Flash figyelem került bevezetésre a képzési folyamat felgyorsítása érdekében.
  7. A modell 32 rétegből áll, beágyazási mérete 4096, és 32 figyelemfelkeltő fejet tartalmaz.

Ami a licencet illeti, a Qwen-7B igazodik a Llama-2. Megengedi a kereskedelmi felhasználást, de a felhasználói mennyiségre vonatkozó kikötéssel. Míg LlamaA -2 ezt a felső határt havi 700 millió aktív felhasználóban határozza meg, a Qwen-7B küszöbe 100 millió.

Azok, akik mélyreható vizsgálatot szeretnének, a GitHubon elérhető technikai jelentést tekinthetik meg. Ezenkívül a Qwen-7B bemutatója, amely kínai nyelven áll rendelkezésre, elérhető azok számára, akiket a modell képességeinek gyakorlati felfedezése érdekel.

Tudjon meg többet az AI-ról:

A felelősség megtagadása

Összhangban a A Trust Project irányelvei, kérjük, vegye figyelembe, hogy az ezen az oldalon közölt információk nem minősülnek jogi, adózási, befektetési, pénzügyi vagy bármilyen más formájú tanácsnak, és nem is értelmezhetők. Fontos, hogy csak annyit fektessen be, amennyit megengedhet magának, hogy elveszítsen, és kérjen független pénzügyi tanácsot, ha kétségei vannak. További információkért javasoljuk, hogy tekintse meg a szerződési feltételeket, valamint a kibocsátó vagy hirdető által biztosított súgó- és támogatási oldalakat. MetaversePost elkötelezett a pontos, elfogulatlan jelentéstétel mellett, de a piaci feltételek előzetes értesítés nélkül változhatnak.

A szerzőről

Damir a csapat vezetője, termékmenedzsere és szerkesztője Metaverse Post, olyan témákkal foglalkozik, mint az AI/ML, AGI, LLMs, Metaverse és Web3- kapcsolódó mezők. Cikkei havonta több mint egymillió felhasználót vonzanak. Úgy tűnik, szakértő, aki 10 éves tapasztalattal rendelkezik a SEO és a digitális marketing területén. Damirt a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto és más kiadványok. Digitális nomádként utazik az Egyesült Arab Emírségek, Törökország, Oroszország és a FÁK között. Damir fizikából szerzett bachelor-diplomát, és úgy gondolja, hogy ez megadta neki azokat a kritikus gondolkodási készségeket, amelyek szükségesek ahhoz, hogy sikeres legyen az internet folyamatosan változó táján. 

További cikkek
Damir Jalalov
Damir Jalalov

Damir a csapat vezetője, termékmenedzsere és szerkesztője Metaverse Post, olyan témákkal foglalkozik, mint az AI/ML, AGI, LLMs, Metaverse és Web3- kapcsolódó mezők. Cikkei havonta több mint egymillió felhasználót vonzanak. Úgy tűnik, szakértő, aki 10 éves tapasztalattal rendelkezik a SEO és a digitális marketing területén. Damirt a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto és más kiadványok. Digitális nomádként utazik az Egyesült Arab Emírségek, Törökország, Oroszország és a FÁK között. Damir fizikából szerzett bachelor-diplomát, és úgy gondolja, hogy ez megadta neki azokat a kritikus gondolkodási készségeket, amelyek szükségesek ahhoz, hogy sikeres legyen az internet folyamatosan változó táján. 

A volatilitás közepette nő az intézményi étvágy a Bitcoin ETF-ek felé

A 13F bejelentéseken keresztül közzétett információk jelentős intézményi befektetőket tárnak fel a Bitcoin ETF-ek iránt, ami alátámasztja a ...

Tudjon meg többet

Elérkezett az ítélethirdetés napja: CZ sorsa egyensúlyban van, mivel az Egyesült Államok bírósága mérlegeli a DOJ kérelmét

Changpeng Zhao ítéletet vár ma egy seattle-i amerikai bíróságon.

Tudjon meg többet
Csatlakozzon innovatív technológiai közösségünkhöz
KATT ide
Tovább
A Nexo elindítja a „vadászatot”, hogy a felhasználókat 12 millió dolláros NEXO tokennel jutalmazza az ökoszisztéma iránti elkötelezettségért
piacok Tudósítást Technológia
A Nexo elindítja a „vadászatot”, hogy a felhasználókat 12 millió dolláros NEXO tokennel jutalmazza az ökoszisztéma iránti elkötelezettségért
May 8, 2024
A Revolut Revolut X Exchange Woos Crypto Traders szolgáltatása nulla gyártói díjjal és fejlett elemzéssel
piacok szoftver Történetek és vélemények Technológia
A Revolut Revolut X Exchange Woos Crypto Traders szolgáltatása nulla gyártói díjjal és fejlett elemzéssel
May 8, 2024
A kriptográfiai kereskedési platform, a BitMEX bemutatja az opciós kereskedést 0 díjjal és készpénzes ösztönzőkkel
üzleti piacok Tudósítást
A kriptográfiai kereskedési platform, a BitMEX bemutatja az opciós kereskedést 0 díjjal és készpénzes ösztönzőkkel
May 8, 2024
A Lisk hivatalosan áttér az Ethereum Layer 2-re, és bemutatja a Core v4.0.6-ot
Tudósítást Technológia
A Lisk hivatalosan áttér az Ethereum Layer 2-re, és bemutatja a Core v4.0.6-ot
May 8, 2024
CRYPTOMERIA LABS PTE. KFT.