Jaanuar 25, 2024

AI4Bharat annab välja "Airavata", kohandatud LLM-i, mis täiustab AI mudelites hindi keelt

Avaldatud: 25. jaanuar 2024 kell 5:32 Värskendatud: 25. jaanuar 2024 kell 5:32

Redigeeritud ja faktidega kontrollitud: 25. jaanuar 2024 kell 5:32

Põgusalt

India AI4Bharat teatas OpenHathi peenhäälestusega loodud LLM-i "Airavata" väljaandmisest, mis parandab AI mudelite hindi keele tuge.

AI4Bharat annab välja hindi keele täiustatud toe jaoks kohandatud LLM-i Airavat

India kõrgharidusinstituudi IIT Madras AI uurimislabor AI4Bharat andis välja Airavata, hindi keele juhiste järgi häälestatud mudeli. Teate kohaselt on mudel ehitatud Sarvam AI OpenHathi peenhäälestamisel koos erinevate Hindi andmekogumitega, et see sobiks paremini abistavate ülesannete jaoks.

Hindi keel on Indias enim räägitud keel, mille emakeel kõneleb üle 43%.

"Praegu toetab Airavata hindi keelt, kuid plaanime seda varsti laiendada kõigile 22 plaanitud india keelele," ütles AI labor. LinkedIni postitus. Oluline on märkida, et jõudlus suured keelemudelid (LLM-id) tugineb kvaliteetsetele juhiste häälestamise andmekogumitele. Hindi jaoks on aga saadaval vähe erinevaid andmekogumeid.

Märkimisväärseid edusamme on tehtud ka eelkoolituse (nt RedPajama) jaoks mõeldud andmekogumite väljatöötamisel; juhiste häälestamine nagu Alpaca, UltraChat, Dolly, OpenAssistant, LMSYS-Chat; ja hindamiskriteeriumid nagu AlpacaEval, MT-Bench. Enamik neist edusammudest on aga keskendunud valdavalt inglise keelele.

"India keelte tugi on piiratud, mille põhjuseks võib olla mõnede india keele andmete juhuslik kaasamine, mis libisesid nende keelemudelite eelkoolituse ajal andmefiltritest läbi. Andmete esitus, tokenisaatorite tõhusus ja ülesannete täitmine india keelte puhul jäävad aga inglise keele omast tunduvalt alla,“ ütles AI4Bharat Labs. öeldi oma avalduses.

"Esitus india keeltes, isegi suletud lähtekoodiga mudelitel, näiteks ChatGPT, GPT-4 ja teised, on inglise keelega võrreldes kehvem,” lisati.

AI4Bharat annab välja juhiste häälestamise andmekogumid

AI4Bharati meeskond avaldas ka juhiste häälestamise andmekogumid kasutatakse mudeli jaoks, et võimaldada IndicLLM-ide edasist uurimist.

"Airavata" tugineb juhiste järgi kohandatud mudelite väljatöötamiseks inimeste kureeritud andmekogumitele, mis on litsentsilepingutega sõbralikud. Meeskond väldib konkreetselt selliste patenteeritud mudelite alusel loodud andmete kasutamist GPT-4 sest see suurendaks kulusid ja piiraks litsentsipiirangute tõttu nende mudelite tasuta kasutamist teistes rakendustes.

Selle asemel usub meeskond, et inimeste kureeritud andmekogumid on jätkusuutlikum lähenemisviis enamiku india keelte mudelite loomiseks.

Airavata, nagu ka teised LLM-id, puutub aga kokku tüüpiliste väljakutsetega. Nende hulka kuuluvad hallutsinatsioonide võimalus, mis viib väljamõeldud teabeni ja võib keeruliste või spetsiifiliste teemade täpsusega vaeva näha. Samuti on oht tekitada taunitavat või kallutatud sisu.

Meeskond selgitas, et mudel on mõeldud uurimistööks ja seda ei soovitata kasutada ühelgi tootmisotstarbel.

Varem käivitas AI4Bharati labor avatud lähtekoodiga videote edastamise platvormi – Chitralekha –, mis sisaldab tööjõuhaldussüsteemi, mis hõlbustab video täielikku ülekandmist ühest keelest teise, hõlmates tõlgitud keele transkriptsiooni, tõlkimist ja kõnet.

See loodi koostöös EkStepiga – mittetulundusühinguga ja meeskonnaga, kes aitas kaasa India Aadhaari projekti arendamisele.

Lisaks on AI4Bharat algatanud oma tehisintellekti residentide ja sidusprogrammide värbamisprotsessi perioodiks 2024–25. See aasta kestev eeldoktorantuur rõhutab intensiivset tööd loomuliku keele töötlemine (NLP), kõne- ja visiooniprojektid.

Kaebused

Vastavalt Usaldusprojekti juhised, pange tähele, et sellel lehel esitatud teave ei ole mõeldud ega tohiks tõlgendada kui juriidilist, maksu-, investeerimis-, finants- või muud nõuannet. Oluline on investeerida ainult seda, mida saate endale lubada kaotada, ja kahtluste korral küsida sõltumatut finantsnõu. Lisateabe saamiseks soovitame vaadata nõudeid ja tingimusi ning väljaandja või reklaamija pakutavaid abi- ja tugilehti. MetaversePost on pühendunud täpsele ja erapooletule aruandlusele, kuid turutingimusi võidakse ette teatamata muuta.

Umbes Autor

Kumar on kogenud tehnikaajakirjanik, kes on spetsialiseerunud AI/ML dünaamilistele ristumiskohtadele, turundustehnoloogiale ja sellistele arenevatele valdkondadele nagu krüpto, plokiahel ja NFTs. Üle 3-aastase tööstusharu kogemusega Kumar on loonud tõestatud kogemusi mõjuvate narratiivide koostamisel, läbinägelike intervjuude läbiviimisel ja põhjaliku ülevaate andmisel. Kumari teadmised seisnevad silmapaistvatele tööstusplatvormidele suure mõjuga sisu, sealhulgas artiklite, aruannete ja teaduspublikatsioonide loomisel. Unikaalse oskuste kogumiga, mis ühendab tehnilised teadmised ja jutuvestmise, suudab Kumar suurepäraselt edastada keerulisi tehnoloogilisi kontseptsioone erinevatele sihtrühmadele selgel ja kaasahaaraval viisil.

Veel artikleid

Kumar Gandharv