Uudiste reportaaž Tehnoloogia
Jaanuar 25, 2024

AI4Bharat annab välja "Airavata", kohandatud LLM-i, mis täiustab AI mudelites hindi keelt

Põgusalt

India AI4Bharat teatas OpenHathi peenhäälestusega loodud LLM-i "Airavata" väljaandmisest, mis parandab AI mudelite hindi keele tuge.

AI4Bharat annab välja hindi keele täiustatud toe jaoks kohandatud LLM-i Airavat

India kõrgharidusinstituudi IIT Madras AI uurimislabor AI4Bharat andis välja Airavata, hindi keele juhiste järgi häälestatud mudeli. Teate kohaselt on mudel ehitatud Sarvam AI OpenHathi peenhäälestamisel koos erinevate Hindi andmekogumitega, et see sobiks paremini abistavate ülesannete jaoks.

Hindi keel on Indias enim räägitud keel, mille emakeel kõneleb üle 43%.

"Praegu toetab Airavata hindi keelt, kuid plaanime seda varsti laiendada kõigile 22 plaanitud india keelele," ütles AI labor. LinkedIni postitus. Oluline on märkida, et jõudlus suured keelemudelid (LLM-id) tugineb kvaliteetsetele juhiste häälestamise andmekogumitele. Hindi jaoks on aga saadaval vähe erinevaid andmekogumeid.

Märkimisväärseid edusamme on tehtud ka eelkoolituse (nt RedPajama) jaoks mõeldud andmekogumite väljatöötamisel; juhiste häälestamine nagu Alpaca, UltraChat, Dolly, OpenAssistant, LMSYS-Chat; ja hindamiskriteeriumid nagu AlpacaEval, MT-Bench. Enamik neist edusammudest on aga keskendunud valdavalt inglise keelele.

"India keelte tugi on piiratud, mille põhjuseks võib olla mõnede india keele andmete juhuslik kaasamine, mis libisesid nende keelemudelite eelkoolituse ajal andmefiltritest läbi. Andmete esitus, tokenisaatorite tõhusus ja ülesannete täitmine india keelte puhul jäävad aga inglise keele omast tunduvalt alla,“ ütles AI4Bharat Labs. öeldi oma avalduses.

"Esitus india keeltes, isegi suletud lähtekoodiga mudelitel, näiteks ChatGPT, GPT-4 ja teised, on inglise keelega võrreldes kehvem,” lisati.

AI4Bharat annab välja juhiste häälestamise andmekogumid

AI4Bharati meeskond avaldas ka juhiste häälestamise andmekogumid kasutatakse mudeli jaoks, et võimaldada IndicLLM-ide edasist uurimist.

"Airavata" tugineb juhiste järgi kohandatud mudelite väljatöötamiseks inimeste kureeritud andmekogumitele, mis on litsentsilepingutega sõbralikud. Meeskond väldib konkreetselt selliste patenteeritud mudelite alusel loodud andmete kasutamist GPT-4 sest see suurendaks kulusid ja piiraks litsentsipiirangute tõttu nende mudelite tasuta kasutamist teistes rakendustes.

Selle asemel usub meeskond, et inimeste kureeritud andmekogumid on jätkusuutlikum lähenemisviis enamiku india keelte mudelite loomiseks.

Airavata, nagu ka teised LLM-id, puutub aga kokku tüüpiliste väljakutsetega. Nende hulka kuuluvad hallutsinatsioonide võimalus, mis viib väljamõeldud teabeni ja võib keeruliste või spetsiifiliste teemade täpsusega vaeva näha. Samuti on oht tekitada taunitavat või kallutatud sisu.

Meeskond selgitas, et mudel on mõeldud uurimistööks ja seda ei soovitata kasutada ühelgi tootmisotstarbel.

Varem käivitas AI4Bharati labor avatud lähtekoodiga videote edastamise platvormi – Chitralekha –, mis sisaldab tööjõuhaldussüsteemi, mis hõlbustab video täielikku ülekandmist ühest keelest teise, hõlmates tõlgitud keele transkriptsiooni, tõlkimist ja kõnet.

See loodi koostöös EkStepiga – mittetulundusühinguga ja meeskonnaga, kes aitas kaasa India Aadhaari projekti arendamisele.

Lisaks on AI4Bharat algatanud oma tehisintellekti residentide ja sidusprogrammide värbamisprotsessi perioodiks 2024–25. See aasta kestev eeldoktorantuur rõhutab intensiivset tööd loomuliku keele töötlemine (NLP), kõne- ja visiooniprojektid.

Kaebused

Vastavalt Usaldusprojekti juhised, pange tähele, et sellel lehel esitatud teave ei ole mõeldud ega tohiks tõlgendada kui juriidilist, maksu-, investeerimis-, finants- või muud nõuannet. Oluline on investeerida ainult seda, mida saate endale lubada kaotada, ja kahtluste korral küsida sõltumatut finantsnõu. Lisateabe saamiseks soovitame vaadata nõudeid ja tingimusi ning väljaandja või reklaamija pakutavaid abi- ja tugilehti. MetaversePost on pühendunud täpsele ja erapooletule aruandlusele, kuid turutingimusi võidakse ette teatamata muuta.

Umbes Autor

Kumar on kogenud tehnikaajakirjanik, kes on spetsialiseerunud AI/ML dünaamilistele ristumiskohtadele, turundustehnoloogiale ja sellistele arenevatele valdkondadele nagu krüpto, plokiahel ja NFTs. Üle 3-aastase tööstusharu kogemusega Kumar on loonud tõestatud kogemusi mõjuvate narratiivide koostamisel, läbinägelike intervjuude läbiviimisel ja põhjaliku ülevaate andmisel. Kumari teadmised seisnevad silmapaistvatele tööstusplatvormidele suure mõjuga sisu, sealhulgas artiklite, aruannete ja teaduspublikatsioonide loomisel. Unikaalse oskuste kogumiga, mis ühendab tehnilised teadmised ja jutuvestmise, suudab Kumar suurepäraselt edastada keerulisi tehnoloogilisi kontseptsioone erinevatele sihtrühmadele selgel ja kaasahaaraval viisil.

Veel artikleid
Kumar Gandharv
Kumar Gandharv

Kumar on kogenud tehnikaajakirjanik, kes on spetsialiseerunud AI/ML dünaamilistele ristumiskohtadele, turundustehnoloogiale ja sellistele arenevatele valdkondadele nagu krüpto, plokiahel ja NFTs. Üle 3-aastase tööstusharu kogemusega Kumar on loonud tõestatud kogemusi mõjuvate narratiivide koostamisel, läbinägelike intervjuude läbiviimisel ja põhjaliku ülevaate andmisel. Kumari teadmised seisnevad silmapaistvatele tööstusplatvormidele suure mõjuga sisu, sealhulgas artiklite, aruannete ja teaduspublikatsioonide loomisel. Unikaalse oskuste kogumiga, mis ühendab tehnilised teadmised ja jutuvestmise, suudab Kumar suurepäraselt edastada keerulisi tehnoloogilisi kontseptsioone erinevatele sihtrühmadele selgel ja kaasahaaraval viisil.

Institutsionaalne isu kasvab volatiilsuse tõttu Bitcoini ETF-ide poole

13F-i dokumentide kaudu avaldatud teave paljastab märkimisväärsed institutsionaalsed investorid, kes tegelevad Bitcoini ETF-idega, rõhutades, et ...

Rohkem teada

Karistuspäev saabub: CZ saatus on tasakaalus, kuna USA kohus võtab DOJ palvet arvesse

Changpeng Zhao ootab täna ees kohtuotsus USA Seattle'i kohtus.

Rohkem teada
Liituge meie uuendusliku tehnikakogukonnaga
Loe rohkem
Loe edasi
L3 Blockchain Degen Chain teeb oma seisakuprobleemi lahendamiseks koostööd infrastruktuuriplatvormi kanaliga
Uudiste reportaaž Tehnoloogia
L3 Blockchain Degen Chain teeb oma seisakuprobleemi lahendamiseks koostööd infrastruktuuriplatvormi kanaliga
Võib 13 2024
Pariteedi mitme signatuuriga rahakotist pesti täna 3,050 ETH-d, mille häkkerite kontrolli all on 83,017 XNUMX ETH-d, mis tuvastab Cyversi hoiatused
turud Uudiste reportaaž Tehnoloogia
Pariteedi mitme signatuuriga rahakotist pesti täna 3,050 ETH-d, mille häkkerite kontrolli all on 83,017 XNUMX ETH-d, mis tuvastab Cyversi hoiatused
Võib 13 2024
ZKP-dega töötav kaevandusalgoritm Soland kuulutab välja oma turuletoomise ja 20-päevase kaevandustöö eelmüügi
Uudiste reportaaž Tehnoloogia
ZKP-dega töötav kaevandusalgoritm Soland kuulutab välja oma turuletoomise ja 20-päevase kaevandustöö eelmüügi
Võib 13 2024
Notcoin kavatseb jagada 5% oma märgivarust 500,000 XNUMX kogukonna liikmele ja krüptovahetuse kasutajale
turud Uudiste reportaaž Tehnoloogia
Notcoin kavatseb jagada 5% oma märgivarust 500,000 XNUMX kogukonna liikmele ja krüptovahetuse kasutajale
Võib 13 2024
CRYPTOMERIA LABS PTE. LTD.