Naujienų ataskaita Technologija
Vasaris 24, 2023

Meta leidimai LLaMA: moderniausias DI tyrimų pamatinės kalbos modelis

Trumpai

„Meta“ paskelbė apie naujo didelio kalbinio modelio išleidimą LLaMA, skirtas padėti AI tyrėjams tobulinti savo darbą AI srityje.

LLaMA yra kelių dydžių, nuo 7B iki 65B parametrų, ir yra sukurtas taip, kad būtų universalus.

Meta llama

Meta turi išleido vadinamas naujas didelis kalbos modelis LLaMA (Large Language Model Meta AI), skirta dirbtinio intelekto tyrinėtojams paremti. Šis modelis leis daugiau mokslininkų bendruomenės atstovų studijuoti kalbos modeliai ir palengvinti prieigą prie šios svarbios srities.

LLaMA yra kelių dydžių (7B, 13B, 33B ir 65B parametrai). Treniruodami mažesnius pamatų modelius kaip LLaMA, mokslininkai gali naudoti mažiau skaičiavimo galios ir išteklių, kad išbandytų naujus metodus ir ištirtų naujus naudojimo atvejus. Meta tai parašė LLaMA puikiai tinka įvairioms užduotims koreguoti, nes treniruojasi su dideliu nepažymėtų duomenų rinkiniu. Meta teigia esanti atsakinga už AI praktiką ir dalijasi a LLAMA modelis kortelė išsamiai aprašoma, kaip buvo sukurtas modelis.

Išvystyti LLaMA, Meta atrinko tekstus iš 20 plačiausiai vartojamų kalbų, daugiausia dėmesio skirdami kalboms, kuriose vartojamos lotyniškos ir kirilicos abėcėlės. Šis didelis kalbos modelis generuoja tekstą kaip įvestį paimdamas žodžių seką ir rekursyviai numatydamas kitą žodį, panašiai kaip ir kiti šios kategorijos modeliai.

„Kaip pamatinis modelis, LLaMA sukurtas taip, kad būtų universalus ir gali būti pritaikytas įvairiems naudojimo atvejams, palyginti su tiksliai suderintu modeliu, skirtu konkrečiai užduočiai atlikti. Pasidalydami kodu LLaMA, kita mokslininkai gali lengviau išbandyti naujus metodus apriboti arba pašalinti šias problemas dideliuose kalbų modeliuose.

Meta rašė.

Bendrovė pripažįsta, kad vis dar reikia spręsti šališkumo, toksiškų komentarų ir haliucinacijų riziką kalbos modeliai, Įskaitant LLaMA.

„Meta“ išleidžia modelį pagal nekomercinę licenciją, orientuotą į mokslinius naudojimo atvejus „siekdama išlaikyti vientisumą ir užkirsti kelią netinkamam naudojimui“. Asmenys ir organizacijos, norintys naudotis modeliu, bus vertinami kiekvienu konkrečiu atveju. Tinkamos šalys yra akademiniai mokslininkai, vyriausybės ir pilietinės visuomenės organizacijos bei pramonės tyrimų laboratorijos visame pasaulyje.

Galite perskaityti visą straipsnį LLaMA čia. Jei tinka, taip pat galite taikyti išbandyti kalbos modelį.

Plačiau paskaitykite čia:

Žymos:

Atsakomybės neigimas

Remdamasi tuo, Pasitikėjimo projekto gairės, atkreipkite dėmesį, kad šiame puslapyje pateikta informacija nėra skirta ir neturėtų būti aiškinama kaip teisinė, mokesčių, investicinė, finansinė ar bet kokia kita konsultacija. Svarbu investuoti tik tai, ką galite sau leisti prarasti, ir, jei turite kokių nors abejonių, kreiptis į nepriklausomą finansinę konsultaciją. Norėdami gauti daugiau informacijos, siūlome peržiūrėti taisykles ir nuostatas bei pagalbos ir palaikymo puslapius, kuriuos pateikia išdavėjas arba reklamuotojas. MetaversePost yra įsipareigojusi teikti tikslias, nešališkas ataskaitas, tačiau rinkos sąlygos gali keistis be įspėjimo.

Apie autorių

Agnė yra žurnalistė, kuri pasakoja apie naujausias tendencijas ir pokyčius metaverse, AI ir Web3 pramonės šakoms Metaverse Post. Jos aistra pasakojimui paskatino ją vesti daugybę interviu su šių sričių ekspertais, visada siekdama atskleisti įdomių ir įtraukiančių istorijų. Agnė yra įgijusi literatūros bakalauro laipsnį ir daug rašo įvairiomis temomis, įskaitant keliones, meną ir kultūrą. Ji taip pat savanoriavo gyvūnų teisių organizacijos redaktore, kur padėjo didinti informuotumą apie gyvūnų gerovės problemas. Susisiekite su ja [apsaugotas el. paštu].

Daugiau straipsnių
Agnė Cimerman
Agnė Cimerman

Agnė yra žurnalistė, kuri pasakoja apie naujausias tendencijas ir pokyčius metaverse, AI ir Web3 pramonės šakoms Metaverse Post. Jos aistra pasakojimui paskatino ją vesti daugybę interviu su šių sričių ekspertais, visada siekdama atskleisti įdomių ir įtraukiančių istorijų. Agnė yra įgijusi literatūros bakalauro laipsnį ir daug rašo įvairiomis temomis, įskaitant keliones, meną ir kultūrą. Ji taip pat savanoriavo gyvūnų teisių organizacijos redaktore, kur padėjo didinti informuotumą apie gyvūnų gerovės problemas. Susisiekite su ja [apsaugotas el. paštu].

Institucinis apetitas Bitcoin ETF atžvilgiu auga dėl nepastovumo

13F paraiškų atskleidimas atskleidžia žymius institucinius investuotojus, kurie naudojasi Bitcoin ETF, o tai rodo, kad vis labiau pritariama...

Žinoti daugiau

Ateina nuosprendžio paskelbimo diena: CZ likimas subalansuotas, nes JAV teismas svarsto DOJ prašymą

Changpeng Zhao šiandien laukia nuosprendžio JAV teisme Sietle.

Žinoti daugiau
Prisijunkite prie mūsų naujoviškų technologijų bendruomenės
Skaityti daugiau
Skaityti daugiau
„Inside Wall Street Memes“ (WSM): antraštės atskleidimas
Atsakingas verslas rinkos Istorijos ir apžvalgos Technologija
„Inside Wall Street Memes“ (WSM): antraštės atskleidimas
Gali 7, 2024
Atraskite kriptografinius banginius: kas yra kas rinkoje
Atsakingas verslas rinkos Istorijos ir apžvalgos Technologija
Atraskite kriptografinius banginius: kas yra kas rinkoje
Gali 7, 2024
„Orbiter Finance“ partneriai su „Bitcoin Layer 2 Zulu“ tinklu ir diegia „Lwazi Testnet“
Atsakingas verslas Naujienų ataskaita Technologija
„Orbiter Finance“ partneriai su „Bitcoin Layer 2 Zulu“ tinklu ir diegia „Lwazi Testnet“ 
Gali 7, 2024
„Crypto Exchange Bybit“ integruoja „Ethena Labs“ USDe kaip įkaito turtą, įgalina BTC-USDe ir ETH-USDe prekybos poras
rinkos Naujienų ataskaita Technologija
„Crypto Exchange Bybit“ integruoja „Ethena Labs“ USDe kaip įkaito turtą, įgalina BTC-USDe ir ETH-USDe prekybos poras
Gali 7, 2024
CRYPTOMERIA LABS PTE. LTD.