AI4Bharat vydáva „Airavata“, vlastný LLM na zlepšenie hindského jazyka v modeloch AI
Stručne
Indická spoločnosť AI4Bharat oznámila vydanie „Airavata“, LLM na zlepšenie podpory hindského jazyka v modeloch AI, postavenej na doladení OpenHathi.
Výskumné laboratórium AI indického inštitútu vysokoškolského vzdelávania IIT Madras AI4Bharat vydala Airavata, inštruktážne ladený model pre hindčinu. Podľa oznámenia bol model vytvorený doladením OpenHathi Sarvam AI s rôznymi hindskými súbormi údajov, aby bol vhodnejší na pomocné úlohy.
Hindčina je najpoužívanejším jazykom v Indii s viac ako 43 % rodenými hovorcami.
„Airavata v súčasnosti podporuje hindčinu, ale čoskoro ju plánujeme rozšíriť na všetkých 22 naplánovaných indických jazykov,“ uviedlo laboratórium AI v Príspevok na LinkedIn. Je dôležité poznamenať, že výkon veľké jazykové modely (LLM) sa spolieha na vysokokvalitné dátové súbory na ladenie inštrukcií. Existuje však nedostatok rôznych súborov údajov dostupných pre hindčinu.
Veľký pokrok sa dosiahol aj vo vývoji súborov údajov pre predškolenie, ako je RedPajama; ladenie inštrukcií ako Alpaca, UltraChat, Dolly, OpenAssistant, LMSYS-Chat; a hodnotiace benchmarky ako AlpacaEval, MT-Bench. Väčšina týchto pokrokov sa však sústredila predovšetkým na anglický jazyk.
„Existuje určitá obmedzená podpora pre indické jazyky, čo možno pripísať náhodnému zahrnutiu niektorých údajov o indickom jazyku, ktoré prešli cez dátové filtre počas predbežného školenia týchto jazykových modelov. Reprezentácia údajov, účinnosť tokenizérov a výkon úloh pre indické jazyky však výrazne zaostávajú za angličtinou,“ AI4Bharat Labs uviedla vo svojom stanovisku.
„Výkon v indických jazykoch, dokonca aj na uzavretých modeloch, ako napr ChatGPT, GPT-4 a ďalšie, je v porovnaní s angličtinou menejcenná,“ dodal.
AI4Bharat vydáva dátové sady ladenia pokynov
Tím AI4Bharat tiež vydal ladenie pokynov dátovej sady použité pre model na umožnenie ďalšieho výskumu pre IndicLLM.
„Airavata“ sa spolieha na súbory údajov spravovaných ľuďmi, ktoré sú priateľské k licenčným dohodám na vývoj modelov prispôsobených inštrukciám. Tím sa konkrétne vyhýba používaniu údajov generovaných z proprietárnych modelov, ako je napr GPT-4 pretože by to zvýšilo náklady a obmedzilo bezplatné používanie týchto modelov v iných aplikáciách v dôsledku licenčných obmedzení.
Namiesto toho sa tím domnieva, že súbory údajov spravované ľuďmi sú udržateľnejším prístupom na vytváranie modelov pre väčšinu indických jazykov.
Airavata, podobne ako iné LLM, však naráža na typické výzvy. Patrí medzi ne možnosť halucinácií, ktoré vedú k vymysleným informáciám a môžu mať problémy s presnosťou v zložitých alebo špecializovaných témach. Existuje tiež riziko, že sa vytvorí nevhodný alebo neobjektívny obsah.
Tím objasnil, že model je určený na výskumné účely a neodporúča sa pre žiadne prípady použitia vo výrobe.
Predtým laboratórium AI4Bharat spustilo open source platformu na transkreáciu videa – Chitralekha – ktorá zahŕňa systém riadenia pracovnej sily, ktorý uľahčuje kompletný proces prepisu videa z jedného jazyka do druhého, ktorý zahŕňa prepis, preklad a hlasový záznam pre preložený jazyk.
Bol vytvorený v spolupráci s EkStep – neziskovou nadáciou a tímom, ktorý bol nápomocný pri rozvoji indického projektu Aadhaar.
Okrem toho spoločnosť AI4Bharat iniciovala náborový proces pre svoj rezidentský a pridružený program AI na obdobie 2024-25. Tento celoročný preddoktorandský program kladie dôraz na intenzívnu prácu v spracovanie prirodzeného jazyka (NLP), rečové a vízové projekty.
Vylúčenie zodpovednosti
V súlade s Pokyny k projektu Trust, uvedomte si, že informácie uvedené na tejto stránke nie sú zamýšľané a nemali by byť interpretované ako právne, daňové, investičné, finančné alebo iné formy poradenstva. Je dôležité investovať len toľko, koľko si môžete dovoliť stratiť a v prípade akýchkoľvek pochybností vyhľadať nezávislé finančné poradenstvo. Ak chcete získať ďalšie informácie, odporúčame vám pozrieť si zmluvné podmienky, ako aj stránky pomoci a podpory poskytnuté vydavateľom alebo inzerentom. MetaversePost sa zaviazala poskytovať presné a nezaujaté správy, ale podmienky na trhu sa môžu zmeniť bez upozornenia.
O autorovi
Kumar je skúsený technický novinár so špecializáciou na dynamické prieniky AI/ML, marketingových technológií a nových oblastí, ako sú krypto, blockchain a NFTs. S viac ako 3-ročnými skúsenosťami v tomto odvetví má Kumar preukázané výsledky pri vytváraní pútavých príbehov, vedení dômyselných rozhovorov a poskytovaní komplexných poznatkov. Kumarova odbornosť spočíva vo vytváraní vysoko účinného obsahu vrátane článkov, správ a výskumných publikácií pre prominentné priemyselné platformy. Vďaka jedinečnému súboru zručností, ktorý kombinuje technické znalosti a rozprávanie príbehov, Kumar vyniká v komunikácii zložitých technologických konceptov pre rôzne publikum jasným a pútavým spôsobom.
Ďalšie článkyKumar je skúsený technický novinár so špecializáciou na dynamické prieniky AI/ML, marketingových technológií a nových oblastí, ako sú krypto, blockchain a NFTs. S viac ako 3-ročnými skúsenosťami v tomto odvetví má Kumar preukázané výsledky pri vytváraní pútavých príbehov, vedení dômyselných rozhovorov a poskytovaní komplexných poznatkov. Kumarova odbornosť spočíva vo vytváraní vysoko účinného obsahu vrátane článkov, správ a výskumných publikácií pre prominentné priemyselné platformy. Vďaka jedinečnému súboru zručností, ktorý kombinuje technické znalosti a rozprávanie príbehov, Kumar vyniká v komunikácii zložitých technologických konceptov pre rôzne publikum jasným a pútavým spôsobom.