Vasaris 24, 2023

Meta leidimai LLaMA: moderniausias DI tyrimų pamatinės kalbos modelis

Paskelbta: 24 m. vasario 2023 d., 12:48 Atnaujinta: 24 m. vasario 2023 d., 12:50

Trumpai

„Meta“ paskelbė apie naujo didelio kalbinio modelio išleidimą LLaMA, skirtas padėti AI tyrėjams tobulinti savo darbą AI srityje.

LLaMA yra kelių dydžių, nuo 7B iki 65B parametrų, ir yra sukurtas taip, kad būtų universalus.

Meta turi išleido vadinamas naujas didelis kalbos modelis LLaMA (Large Language Model Meta AI), skirta dirbtinio intelekto tyrinėtojams paremti. Šis modelis leis daugiau mokslininkų bendruomenės atstovų studijuoti kalbos modeliai ir palengvinti prieigą prie šios svarbios srities.

LLaMA yra kelių dydžių (7B, 13B, 33B ir 65B parametrai). Treniruodami mažesnius pamatų modelius kaip LLaMA, mokslininkai gali naudoti mažiau skaičiavimo galios ir išteklių, kad išbandytų naujus metodus ir ištirtų naujus naudojimo atvejus. Meta tai parašė LLaMA puikiai tinka įvairioms užduotims koreguoti, nes treniruojasi su dideliu nepažymėtų duomenų rinkiniu. Meta teigia esanti atsakinga už AI praktiką ir dalijasi a LLAMA modelis kortelė išsamiai aprašoma, kaip buvo sukurtas modelis.

Išvystyti LLaMA, Meta atrinko tekstus iš 20 plačiausiai vartojamų kalbų, daugiausia dėmesio skirdami kalboms, kuriose vartojamos lotyniškos ir kirilicos abėcėlės. Šis didelis kalbos modelis generuoja tekstą kaip įvestį paimdamas žodžių seką ir rekursyviai numatydamas kitą žodį, panašiai kaip ir kiti šios kategorijos modeliai.

„Kaip pamatinis modelis, LLaMA sukurtas taip, kad būtų universalus ir gali būti pritaikytas įvairiems naudojimo atvejams, palyginti su tiksliai suderintu modeliu, skirtu konkrečiai užduočiai atlikti. Pasidalydami kodu LLaMA, kita mokslininkai gali lengviau išbandyti naujus metodus apriboti arba pašalinti šias problemas dideliuose kalbų modeliuose.
Meta rašė.

Bendrovė pripažįsta, kad vis dar reikia spręsti šališkumo, toksiškų komentarų ir haliucinacijų riziką kalbos modeliai, Įskaitant LLaMA.

„Meta“ išleidžia modelį pagal nekomercinę licenciją, orientuotą į mokslinius naudojimo atvejus „siekdama išlaikyti vientisumą ir užkirsti kelią netinkamam naudojimui“. Asmenys ir organizacijos, norintys naudotis modeliu, bus vertinami kiekvienu konkrečiu atveju. Tinkamos šalys yra akademiniai mokslininkai, vyriausybės ir pilietinės visuomenės organizacijos bei pramonės tyrimų laboratorijos visame pasaulyje.

Galite perskaityti visą straipsnį LLaMA čia. Jei tinka, taip pat galite taikyti išbandyti kalbos modelį.

NUTRAUKIMAS: Meta praneša apie naują didelės kalbos modelį, pavadintą LLaMA pic.twitter.com/4G46KmSFRJ
– Pitas (@nonmayorpete) Vasaris 24, 2023

Plačiau paskaitykite čia:

Žymos:

LLaMA
meta

Atsakomybės neigimas

Remdamasi tuo, Pasitikėjimo projekto gairės, atkreipkite dėmesį, kad šiame puslapyje pateikta informacija nėra skirta ir neturėtų būti aiškinama kaip teisinė, mokesčių, investicinė, finansinė ar bet kokia kita konsultacija. Svarbu investuoti tik tai, ką galite sau leisti prarasti, ir, jei turite kokių nors abejonių, kreiptis į nepriklausomą finansinę konsultaciją. Norėdami gauti daugiau informacijos, siūlome peržiūrėti taisykles ir nuostatas bei pagalbos ir palaikymo puslapius, kuriuos pateikia išdavėjas arba reklamuotojas. MetaversePost yra įsipareigojusi teikti tikslias, nešališkas ataskaitas, tačiau rinkos sąlygos gali keistis be įspėjimo.

Apie autorių

Agnė yra žurnalistė, kuri pasakoja apie naujausias tendencijas ir pokyčius metaverse, AI ir Web3 pramonės šakoms Metaverse Post. Jos aistra pasakojimui paskatino ją vesti daugybę interviu su šių sričių ekspertais, visada siekdama atskleisti įdomių ir įtraukiančių istorijų. Agnė yra įgijusi literatūros bakalauro laipsnį ir daug rašo įvairiomis temomis, įskaitant keliones, meną ir kultūrą. Ji taip pat savanoriavo gyvūnų teisių organizacijos redaktore, kur padėjo didinti informuotumą apie gyvūnų gerovės problemas. Susisiekite su ja [apsaugotas el. paštu].

Daugiau straipsnių

Agnė Cimerman