Novice Tehnologija
Januar 25, 2024

AI4Bharat izda 'Airavata', LLM po meri za izboljšanje hindijskega jezika v modelih AI

Na kratko

Indijski AI4Bharat je napovedal izdajo »Airavata«, študija LLM za izboljšanje podpore za jezik hindijščine v modelih umetne inteligence, zgrajenega s fino nastavitvijo OpenHathi.

AI4Bharat izda 'Airavat', LLM po meri za izboljšano podporo hindijščine

Raziskovalni laboratorij AI indijskega visokošolskega inštituta IIT Madras AI4Bharat je izdal Airavata, model z navodili za hindijščino. Glede na objavo je bil model zgrajen s fino nastavitvijo OpenHathi Sarvam AI z različnimi nabori podatkov v hindijščini, da bi bil bolj primeren za podporna opravila.

Hindujščina je najbolj govorjeni jezik v Indiji z več kot 43 % maternih govorcev.

"Trenutno Airavata podpira hindijščino, vendar nameravamo to kmalu razširiti na vseh 22 predvidenih indijskih jezikov," je dejal laboratorij AI v Objava LinkedIn. Pomembno je omeniti, da uspešnost veliki jezikovni modeli (LLMs) temelji na visokokakovostnih naborih podatkov za uravnavanje navodil. Vendar pa je za hindijščino na voljo malo različnih naborov podatkov.

Velik napredek je bil dosežen tudi pri razvoju naborov podatkov za predhodno usposabljanje, kot je RedPajama; nastavitev navodil, kot so Alpaca, UltraChat, Dolly, OpenAssistant, LMSYS-Chat; in merila uspešnosti vrednotenja, kot sta AlpacaEval, MT-Bench. Vendar je bila večina teh napredkov osredotočena predvsem na angleški jezik.

»Podpora za indijske jezike je omejena, kar je mogoče pripisati naključni vključitvi nekaterih podatkov o indijskem jeziku, ki so zdrsnili skozi podatkovne filtre med predhodnim usposabljanjem teh jezikovnih modelov. Vendar predstavitev podatkov, učinkovitost tokenizatorjev in uspešnost nalog za indijske jezike precej zaostajajo za angleščino,« AI4Bharat Labs je dejal v svoji izjavi.

»Predstava v indijskih jezikih, tudi na zaprtokodnih modelih, kot je npr ChatGPT, GPT-4 in drugi, je slabša v primerjavi z angleščino,« je dodal.

AI4Bharat izdaja nabore podatkov za uravnavanje navodil

Ekipa AI4Bharat je izdala tudi nastavitev navodil nabor podatkov uporabljen za model za omogočanje nadaljnjih raziskav za IndicLLM.

»Airavata« se pri razvoju modelov, prilagojenih navodilom, opira na nabore podatkov, ki jih pripravi človek in so prijazni do licenčnih pogodb. Ekipa se posebej izogiba uporabi podatkov, ustvarjenih iz lastniških modelov, kot je GPT-4 ker bi to povečalo stroške in omejilo brezplačno uporabo teh modelov v drugih aplikacijah zaradi licenčnih omejitev.

Namesto tega skupina verjame, da so nabori podatkov, ki jih pripravi človek, bolj trajnosten pristop za gradnjo modelov za večino indijskih jezikov.

Vendar se Airavata, tako kot drugi LLM, srečuje s tipičnimi izzivi. Ti vključujejo možnost halucinacij, ki vodijo do izmišljenih informacij in so lahko težave z natančnostjo pri kompleksnih ali specializiranih temah. Obstaja tudi nevarnost ustvarjanja sporne ali pristranske vsebine.

Ekipa je pojasnila, da je model za raziskovalne namene in ni priporočljiv za nobene primere proizvodne uporabe.

Pred tem je laboratorij AI4Bharat lansiral odprtokodno platformo za transkreacijo videoposnetkov – Chitralekha – ki vključuje sistem za upravljanje delovne sile, ki olajša celoten proces transkreacije videoposnetka iz enega jezika v drugega, ki zajema transkripcijo, prevod in glasovni prenos za prevedeni jezik.

Ustvarjen je bil v sodelovanju z EkStep – neprofitno fundacijo in ekipo, ki je bila ključna pri razvoju indijskega projekta Aadhaar.

Poleg tega je AI4Bharat sprožil postopek zaposlovanja za svoj rezidenčni in pridruženi program AI za obdobje 2024–25. Ta celoletni predoktorski program poudarja intenzivno delo v obdelava naravnega jezika (NLP), projekti govora in vida.

Zavrnitev odgovornosti

V skladu z Smernice projekta Trust, upoštevajte, da informacije na tej strani niso namenjene in se jih ne sme razlagati kot pravni, davčni, naložbeni, finančni ali kakršen koli drug nasvet. Pomembno je, da vlagate samo tisto, kar si lahko privoščite izgubiti, in da poiščete neodvisen finančni nasvet, če imate kakršne koli dvome. Za dodatne informacije predlagamo, da si ogledate določila in pogoje ter strani s pomočjo in podporo, ki jih nudi izdajatelj ali oglaševalec. MetaversePost se zavzema za natančno in nepristransko poročanje, vendar se tržni pogoji lahko spremenijo brez predhodnega obvestila.

O avtorju

Kumar je izkušen tehnični novinar, specializiran za dinamična presečišča AI/ML, marketinške tehnologije in nastajajočih področij, kot so kripto, blockchain in NFTs. Z več kot 3 leti izkušenj v panogi je Kumar pridobil dokazane rezultate pri oblikovanju privlačnih pripovedi, vodenju pronicljivih intervjujev in zagotavljanju celovitih vpogledov. Kumarjevo strokovno znanje je v izdelavi odmevnih vsebin, vključno s članki, poročili in raziskovalnimi publikacijami za pomembne industrijske platforme. Z edinstvenim naborom spretnosti, ki združuje tehnično znanje in pripovedovanje zgodb, se Kumar odlikuje pri sporočanju zapletenih tehnoloških konceptov različnim občinstvom na jasen in privlačen način.

več člankov
Kumar Gandharv
Kumar Gandharv

Kumar je izkušen tehnični novinar, specializiran za dinamična presečišča AI/ML, marketinške tehnologije in nastajajočih področij, kot so kripto, blockchain in NFTs. Z več kot 3 leti izkušenj v panogi je Kumar pridobil dokazane rezultate pri oblikovanju privlačnih pripovedi, vodenju pronicljivih intervjujev in zagotavljanju celovitih vpogledov. Kumarjevo strokovno znanje je v izdelavi odmevnih vsebin, vključno s članki, poročili in raziskovalnimi publikacijami za pomembne industrijske platforme. Z edinstvenim naborom spretnosti, ki združuje tehnično znanje in pripovedovanje zgodb, se Kumar odlikuje pri sporočanju zapletenih tehnoloških konceptov različnim občinstvom na jasen in privlačen način.

Od valovanja do velikega zelenega DAO: Kako projekti kriptovalut prispevajo k dobrodelnosti

Raziščimo pobude, ki izkoriščajo potencial digitalnih valut za dobrodelne namene.

Več o tem

AlphaFold 3, Med-Gemini in drugi: način, kako umetna inteligenca spremeni zdravstveno varstvo leta 2024

Umetna inteligenca se v zdravstvu kaže na različne načine, od odkrivanja novih genetskih povezav do opolnomočenja robotskih kirurških sistemov ...

Več o tem
Pridružite se naši inovativni tehnološki skupnosti
Preberi več
Preberi več
Worldcoinov žeton WLD se bo soočil z agresivnim pritiskom prodaje z več odklepanji v prihodnjih mesecih, opozarja DeFi2 Bybit Trader
Prisotnost Novice Tehnologija
Worldcoinov žeton WLD se bo soočil z agresivnim pritiskom prodaje z več odklepanji v prihodnjih mesecih, opozarja DeFi2 Bybit Trader
Maj 14, 2024
Crypto Exchange Coinbase se sooča s sistemsko napako, skladi uporabnikov Secure Wile Company preiskuje težavo
Prisotnost Novice Tehnologija
Crypto Exchange Coinbase se sooča s sistemsko napako, skladi uporabnikov Secure Wile Company preiskuje težavo
Maj 14, 2024
Od valovanja do velikega zelenega DAO: Kako projekti kriptovalut prispevajo k dobrodelnosti
Analiza Crypto Wiki ŽELITE POSTATI PARTNER Izobraževanje Življenjski slog Prisotnost Software Tehnologija
Od valovanja do velikega zelenega DAO: Kako projekti kriptovalut prispevajo k dobrodelnosti
Maj 13, 2024
AlphaFold 3, Med-Gemini in drugi: način, kako umetna inteligenca spremeni zdravstveno varstvo leta 2024
AI Wiki Analiza prebaviti Mnenje ŽELITE POSTATI PARTNER Prisotnost Novice Software Zgodbe in ocene Tehnologija
AlphaFold 3, Med-Gemini in drugi: način, kako umetna inteligenca spremeni zdravstveno varstvo leta 2024
Maj 13, 2024
CRYPTOMERIA LABS PTE. LTD.