tržišta Vijesti
Kolovoz 08, 2023

Alibaba predstavlja Qwen-7B jezični model otvorenog koda

Alibaba je predstavila svoj open-source Large Language Model (LLM) pod nazivom Qwen-7B, obilježavajući njihov inauguralni ulazak u područje javno dostupnih LLM-ova. Ovaj model je izgrađen na 7 milijardi parametara.

Alibaba predstavlja Qwen-7B jezični model otvorenog koda

Za kontekst, Qwen-7B prošao je obuku koristeći 2.2 trilijuna tokena. Veličina konteksta postavljena tijekom ove faze obuke bila je 2048, dok je korisnici mogu proširiti na najviše 8192 tijekom testiranja. Usporedbe radi, Llama-2, još jedan LLM, nudi veličinu konteksta od 4096.

Mjerila su ključna za mjerenje performansi takvih modela, au tom domenu kineski programeri tvrde da je Qwen-7B nadmašio Llama-2. Jedna metrika koja se ističe je mjerilo kodiranja Human-Eval, gdje Qwen-7B ima ocjenu 24.4 u odnosu na Llama-2 je 12.8. Međutim, mudro je ove brojke promatrati s određenim stupnjem opreza. Neka mjerila pokazuju da Qwen-7B nadmašuje ne samo osnovni model LLama-2-7B ali i LLaMA-2-13B varijanta. Međutim, kada se suprotstavi profinjenim verzijama Llama-2, margina razlike postaje uža. Treba napomenuti da točna metodologija treninga Qwen-7B nije eksplicitno detaljno opisana od strane njegovih programera.

U funkcionalnosti paralelno s LLaMa2-chat, Qwen je predstavio verziju usmjerenu na chat pod nazivom Qwen-7B-Chat. Ovaj je model optimiziran za interakciju s korisnicima i uključuje različite alate i Apis kako bi se poboljšala njegova odzivnost.

One sklone tehničkim detaljima zanimalo bi da Qwen-7B svojim arhitektonskim temeljem podsjeća na LLaMA. Međutim, postoje različite značajke koje razlikuju Qwen-7B:

  1. Zapošljava nevezano ugrađivanje.
  2. Koristi se rotacijsko poziciono umetanje.
  3. Pristranosti su isključene, s izuzetkom QKV u pozornosti.
  4. RMSNorm ima prednost u odnosu na LayerNorm.
  5. Umjesto standardnog ReLU, ugrađen je SwiGLU.
  6. Uvedena je Flash Pažnja kako bi se ubrzao proces obuke.
  7. Model se sastoji od 32 sloja, ima dimenziju ugradnje od 4096 i prima 32 glave za pozornost.

Što se tiče licenciranja, Qwen-7B se slaže s njim Llama-2. Dopušta komercijalnu upotrebu, ali uz uvjet o količini korisnika. Dok Llama-2 postavlja ovo ograničenje na 700 milijuna aktivnih korisnika mjesečno, Qwen-7B prag je 100 milijuna.

Oni koji traže dubinski pregled mogu pogledati tehničko izvješće dostupno na GitHubu. Dodatno, demonstracija Qwen-7B, dostupan na kineskom jeziku, dostupan je onima koji su zainteresirani za praktično istraživanje mogućnosti modela.

Pročitajte više o AI:

Izjava o odricanju od odgovornosti

U skladu s Smjernice projekta povjerenja, imajte na umu da informacije navedene na ovoj stranici nemaju namjeru i ne smiju se tumačiti kao pravni, porezni, investicijski, financijski ili bilo koji drugi oblik savjeta. Važno je ulagati samo ono što si možete priuštiti izgubiti i potražiti neovisni financijski savjet ako imate bilo kakvih nedoumica. Za dodatne informacije predlažemo da pogledate odredbe i uvjete, kao i stranice za pomoć i podršku koje pruža izdavatelj ili oglašivač. MetaversePost je predan točnom, nepristranom izvješćivanju, ali tržišni uvjeti podložni su promjenama bez prethodne najave.

O autoru

Damir je voditelj tima, product manager i urednik u Metaverse Post, koji pokriva teme kao što su AI/ML, AGI, LLMs, Metaverse i Web3- srodna polja. Njegovi članci privlače ogromnu publiku od preko milijun korisnika svakog mjeseca. Čini se da je stručnjak s 10 godina iskustva u SEO-u i digitalnom marketingu. Damir je spomenut u Mashableu, Wiredu, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i druge publikacije. Putuje između UAE, Turske, Rusije i CIS-a kao digitalni nomad. Damir je stekao diplomu prvostupnika fizike, za koju vjeruje da mu je dala vještine kritičkog razmišljanja potrebne za uspjeh u stalno promjenjivom okruženju interneta. 

Više članaka
Damir Yalalov
Damir Yalalov

Damir je voditelj tima, product manager i urednik u Metaverse Post, koji pokriva teme kao što su AI/ML, AGI, LLMs, Metaverse i Web3- srodna polja. Njegovi članci privlače ogromnu publiku od preko milijun korisnika svakog mjeseca. Čini se da je stručnjak s 10 godina iskustva u SEO-u i digitalnom marketingu. Damir je spomenut u Mashableu, Wiredu, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i druge publikacije. Putuje između UAE, Turske, Rusije i CIS-a kao digitalni nomad. Damir je stekao diplomu prvostupnika fizike, za koju vjeruje da mu je dala vještine kritičkog razmišljanja potrebne za uspjeh u stalno promjenjivom okruženju interneta. 

Hot Stories

Inside Wall Street Memes (WSM): otkrivanje naslova

by Viktorija Palčik
Neka 07, 2024

Otkrijte Crypto Whales: Tko je tko na tržištu

by Viktorija Palčik
Neka 07, 2024
Pridružite se našem biltenu.
Najnovije vijesti

Institucionalni apetit raste prema Bitcoin ETF-ovima usred volatilnosti

Objave putem 13F prijava otkrivaju značajne institucionalne ulagače koji se upuštaju u Bitcoin ETF-ove, naglašavajući sve veće prihvaćanje ...

Znati više

Stiže dan izricanja presude: CZ-ova sudbina visi na ravnoteži dok američki sud razmatra izjavu DOJ-a

Changpeng Zhao danas će se suočiti s kaznom na američkom sudu u Seattleu.

Znati više
Pridružite se našoj zajednici inovativnih tehnologija
opširnije
Čitaj više
Inside Wall Street Memes (WSM): otkrivanje naslova
posao tržišta Priče i recenzije Tehnologija
Inside Wall Street Memes (WSM): otkrivanje naslova
Neka 7, 2024
Otkrijte Crypto Whales: Tko je tko na tržištu
posao tržišta Priče i recenzije Tehnologija
Otkrijte Crypto Whales: Tko je tko na tržištu
Neka 7, 2024
Orbiter Finance surađuje s Bitcoin Layer 2 Zulu mrežom i postavlja se na Is Lwazi Testnet
posao Vijesti Tehnologija
Orbiter Finance surađuje s Bitcoin Layer 2 Zulu mrežom i postavlja se na Is Lwazi Testnet 
Neka 7, 2024
Crypto Exchange Bybit integrira USDe Ethena Labs kao kolateralnu imovinu, omogućuje trgovinske parove BTC-USDe i ETH-USDe
tržišta Vijesti Tehnologija
Crypto Exchange Bybit integrira USDe Ethena Labs kao kolateralnu imovinu, omogućuje trgovinske parove BTC-USDe i ETH-USDe
Neka 7, 2024
CRYPTOMERIA LABS PTE. LTD.