Novinová správa Technológia
Januára 25, 2024

AI4Bharat vydáva „Airavata“, vlastný LLM na zlepšenie hindského jazyka v modeloch AI

Stručne

Indická spoločnosť AI4Bharat oznámila vydanie „Airavata“, LLM na zlepšenie podpory hindského jazyka v modeloch AI, postavenej na doladení OpenHathi.

AI4Bharat vydáva 'Airavat', vlastný LLM pre vylepšenú podporu hindského jazyka

Výskumné laboratórium AI indického inštitútu vysokoškolského vzdelávania IIT Madras AI4Bharat vydala Airavata, inštruktážne ladený model pre hindčinu. Podľa oznámenia bol model vytvorený doladením OpenHathi Sarvam AI s rôznymi hindskými súbormi údajov, aby bol vhodnejší na pomocné úlohy.

Hindčina je najpoužívanejším jazykom v Indii s viac ako 43 % rodenými hovorcami.

„Airavata v súčasnosti podporuje hindčinu, ale čoskoro ju plánujeme rozšíriť na všetkých 22 naplánovaných indických jazykov,“ uviedlo laboratórium AI v Príspevok na LinkedIn. Je dôležité poznamenať, že výkon veľké jazykové modely (LLM) sa spolieha na vysokokvalitné dátové súbory na ladenie inštrukcií. Existuje však nedostatok rôznych súborov údajov dostupných pre hindčinu.

Veľký pokrok sa dosiahol aj vo vývoji súborov údajov pre predškolenie, ako je RedPajama; ladenie inštrukcií ako Alpaca, UltraChat, Dolly, OpenAssistant, LMSYS-Chat; a hodnotiace benchmarky ako AlpacaEval, MT-Bench. Väčšina týchto pokrokov sa však sústredila predovšetkým na anglický jazyk.

„Existuje určitá obmedzená podpora pre indické jazyky, čo možno pripísať náhodnému zahrnutiu niektorých údajov o indickom jazyku, ktoré prešli cez dátové filtre počas predbežného školenia týchto jazykových modelov. Reprezentácia údajov, účinnosť tokenizérov a výkon úloh pre indické jazyky však výrazne zaostávajú za angličtinou,“ AI4Bharat Labs uviedla vo svojom stanovisku.

„Výkon v indických jazykoch, dokonca aj na uzavretých modeloch, ako napr ChatGPT, GPT-4 a ďalšie, je v porovnaní s angličtinou menejcenná,“ dodal.

AI4Bharat vydáva dátové sady ladenia pokynov

Tím AI4Bharat tiež vydal ladenie pokynov dátovej sady použité pre model na umožnenie ďalšieho výskumu pre IndicLLM.

„Airavata“ sa spolieha na súbory údajov spravovaných ľuďmi, ktoré sú priateľské k licenčným dohodám na vývoj modelov prispôsobených inštrukciám. Tím sa konkrétne vyhýba používaniu údajov generovaných z proprietárnych modelov, ako je napr GPT-4 pretože by to zvýšilo náklady a obmedzilo bezplatné používanie týchto modelov v iných aplikáciách v dôsledku licenčných obmedzení.

Namiesto toho sa tím domnieva, že súbory údajov spravované ľuďmi sú udržateľnejším prístupom na vytváranie modelov pre väčšinu indických jazykov.

Airavata, podobne ako iné LLM, však naráža na typické výzvy. Patrí medzi ne možnosť halucinácií, ktoré vedú k vymysleným informáciám a môžu mať problémy s presnosťou v zložitých alebo špecializovaných témach. Existuje tiež riziko, že sa vytvorí nevhodný alebo neobjektívny obsah.

Tím objasnil, že model je určený na výskumné účely a neodporúča sa pre žiadne prípady použitia vo výrobe.

Predtým laboratórium AI4Bharat spustilo open source platformu na transkreáciu videa – Chitralekha – ktorá zahŕňa systém riadenia pracovnej sily, ktorý uľahčuje kompletný proces prepisu videa z jedného jazyka do druhého, ktorý zahŕňa prepis, preklad a hlasový záznam pre preložený jazyk.

Bol vytvorený v spolupráci s EkStep – neziskovou nadáciou a tímom, ktorý bol nápomocný pri rozvoji indického projektu Aadhaar.

Okrem toho spoločnosť AI4Bharat iniciovala náborový proces pre svoj rezidentský a pridružený program AI na obdobie 2024-25. Tento celoročný preddoktorandský program kladie dôraz na intenzívnu prácu v spracovanie prirodzeného jazyka (NLP), rečové a vízové ​​projekty.

Vylúčenie zodpovednosti

V súlade s Pokyny k projektu Trust, uvedomte si, že informácie uvedené na tejto stránke nie sú zamýšľané a nemali by byť interpretované ako právne, daňové, investičné, finančné alebo iné formy poradenstva. Je dôležité investovať len toľko, koľko si môžete dovoliť stratiť a v prípade akýchkoľvek pochybností vyhľadať nezávislé finančné poradenstvo. Ak chcete získať ďalšie informácie, odporúčame vám pozrieť si zmluvné podmienky, ako aj stránky pomoci a podpory poskytnuté vydavateľom alebo inzerentom. MetaversePost sa zaviazala poskytovať presné a nezaujaté správy, ale podmienky na trhu sa môžu zmeniť bez upozornenia.

O autorovi

Kumar je skúsený technický novinár so špecializáciou na dynamické prieniky AI/ML, marketingových technológií a nových oblastí, ako sú krypto, blockchain a NFTs. S viac ako 3-ročnými skúsenosťami v tomto odvetví má Kumar preukázané výsledky pri vytváraní pútavých príbehov, vedení dômyselných rozhovorov a poskytovaní komplexných poznatkov. Kumarova odbornosť spočíva vo vytváraní vysoko účinného obsahu vrátane článkov, správ a výskumných publikácií pre prominentné priemyselné platformy. Vďaka jedinečnému súboru zručností, ktorý kombinuje technické znalosti a rozprávanie príbehov, Kumar vyniká v komunikácii zložitých technologických konceptov pre rôzne publikum jasným a pútavým spôsobom.

Ďalšie články
Kumar Gandharv
Kumar Gandharv

Kumar je skúsený technický novinár so špecializáciou na dynamické prieniky AI/ML, marketingových technológií a nových oblastí, ako sú krypto, blockchain a NFTs. S viac ako 3-ročnými skúsenosťami v tomto odvetví má Kumar preukázané výsledky pri vytváraní pútavých príbehov, vedení dômyselných rozhovorov a poskytovaní komplexných poznatkov. Kumarova odbornosť spočíva vo vytváraní vysoko účinného obsahu vrátane článkov, správ a výskumných publikácií pre prominentné priemyselné platformy. Vďaka jedinečnému súboru zručností, ktorý kombinuje technické znalosti a rozprávanie príbehov, Kumar vyniká v komunikácii zložitých technologických konceptov pre rôzne publikum jasným a pútavým spôsobom.

Hot Stories
Pridajte sa k nášmu newsletteru.
Novinky

Od zvlnenia k veľkému zelenému DAO: Ako kryptomenové projekty prispievajú k charite

Poďme preskúmať iniciatívy, ktoré využívajú potenciál digitálnych mien na charitatívne účely.

vedieť viac

AlphaFold 3, Med-Gemini a ďalší: Spôsob, akým AI transformuje zdravotnú starostlivosť v roku 2024

Umelá inteligencia sa v zdravotníctve prejavuje rôznymi spôsobmi, od odhaľovania nových genetických korelácií až po posilnenie robotických chirurgických systémov...

vedieť viac
Pripojte sa k našej komunite inovatívnych technológií
Čítaj viac
Čítaj viac
Token WLD spoločnosti Worldcoin bude čeliť agresívnemu predajnému tlaku s ďalšími odomknutiami v nasledujúcich mesiacoch, varuje DeFi2 Bybit Trader
trhy Novinová správa Technológia
Token WLD spoločnosti Worldcoin bude čeliť agresívnemu predajnému tlaku s ďalšími odomknutiami v nasledujúcich mesiacoch, varuje DeFi2 Bybit Trader
Môže 14, 2024
Zážitky z krypto výmeny Coinbase Zlyhanie systému, fondy používateľov sú zabezpečené podvodom Spoločnosť vyšetruje problém
trhy Novinová správa Technológia
Zážitky z krypto výmeny Coinbase Zlyhanie systému, fondy používateľov sú zabezpečené podvodom Spoločnosť vyšetruje problém
Môže 14, 2024
Od zvlnenia k veľkému zelenému DAO: Ako kryptomenové projekty prispievajú k charite
Analýza Crypto Wiki firmy vzdelanie Životný štýl trhy Softvér Technológia
Od zvlnenia k veľkému zelenému DAO: Ako kryptomenové projekty prispievajú k charite
Môže 13, 2024
AlphaFold 3, Med-Gemini a ďalší: Spôsob, akým AI transformuje zdravotnú starostlivosť v roku 2024
AI Wiki Analýza výťah Názor firmy trhy Novinová správa Softvér Príbehy a recenzie Technológia
AlphaFold 3, Med-Gemini a ďalší: Spôsob, akým AI transformuje zdravotnú starostlivosť v roku 2024
Môže 13, 2024
CRYPTOMERIA LABS PTE. LTD.