Sarvam AI vydává první indickou hindskou LLM „OpenHathi“, týden poté, co získala 41 milionů dolarů
Stručně
OpenHathi společnosti Sarvam AI je první hindský LLM zaměřený na vývoj otevřených modelů a datových sad, aby podporoval inovace AI pro indické jazyky.
Indické spuštění generativní umělé inteligence Sarvam AI propuštěn OpenHathi-Hi-v0.1, první model velkého jazyka hindštiny (LLM) v sérii OpenHathi, jen týden poté zvyšování $ 41 milionů ve svém kole financování série A vedeném společností Lightspeed Ventures.
Hindština je nejrozšířenějším jazykem Indie, více než 43 % obyvatel ji deklaruje jako svůj mateřský jazyk. Model je postaven na Meta AI Llama2-7B architektura a poskytuje výkon na stejné úrovni GPT-3.5 pro indické jazyky.
„Ukazujeme, že náš model funguje stejně dobře, ne-li lépe než GPT-3.5 na různé úkoly v hindštině při zachování své anglické výkonnosti,“ uvedla společnost na platformě sociálních médií X (dříve Twitter).
Ukazujeme, že náš model funguje stejně dobře, ne-li lépe než GPT-3.5 na různé úkoly v hindštině při zachování své anglické výkonnosti. Kromě standardních úkolů NLG také hodnotíme spoustu neakademických úkolů z reálného světa. 3/5
— Sarvam AI (@SarvamAI) 12. prosince 2023
Podle Sarvam AI je cílem série OpenHathi přispět k vývoji otevřených modelů a datových sad na podporu inovací v AI v indickém jazyce a spolupracuje s akademickými partnery v AI4Bharat, kteří pro tuto iniciativu poskytli jazykové zdroje a měřítka.
AI4Bharat je výzkumná laboratoř na Indian Institute of Technology (IIT) Madras – veřejné technické univerzitě v Indii, která pracuje na vývoji open source datových sad, nástrojů, modelů a aplikací pro indické jazyky.
OpenHathi používá rozšíření o 48,000 XNUMX tokenech LlamaTokenizer 2-7B a prochází dvoufázovým tréninkovým procesem. V první fázi se model soustředí na zarovnání vložení, zarovnání náhodně inicializovaných hindských vložení. Druhá fáze zahrnuje bilingvální jazykové modelování, kdy se model učí mezijazyčné pozornosti napříč tokeny.
Plnohodnotná generativní platforma AI bude spuštěnaed Soo
Společnost dále povzbuzuje lidi, aby byli kreativní a přicházeli s novými nápady pomocí a vylepšení této verze. Společnost zve vývojáře, aby vytvořili specializované modely pro různé účely s použitím modelu OpenHathi-Hi-v0.1 jako výchozího bodu.
Sarvam AI také plánuje vydat pokročilé modely pro podniky na svém komplexním generativní AI platforma, která bude podle startupu brzy spuštěna.
Při navyšování svých finančních prostředků pro sérii A společnost oznámila svůj plán vyvinout „kompletní sadu“ pro generativní umělou inteligenci, od inovací vedených výzkumem při trénování vlastních modelů umělé inteligence až po podnikovou platformu pro vytváření a nasazení.
Společnost dodala, že tento komplexní přístup urychlí přijetí generativní umělé inteligence v Indii, zejména vzhledem k tomu, že podniky vidí potenciál, ale řeší, jak jej využít pro své podnikání.
Založena v červenci 2023 Vivek Raghavan a Pratyush Kumar, dříve pracovala v AI4Bharat – podporovaná spoluzakladatelem Infosys Nandanem Nilekanim.
Nedávno Indie spustila BharatGPT, řešení založené na LLM vyvinuté ve spolupráci s indickým startupem CoRover.ai zaměřeným na konverzační umělou inteligenci, které je umístěno jako odpověď na existující generativní AI nebo LLM. Má v úmyslu zaplnit kritickou mezeru na trhu tím, že poskytne domácí řešení dostupné ve více než 12 indických jazycích, které zahrnuje video, hlas a textové interakce.
Odmítnutí odpovědnosti
V souladu s Pokyny k projektu Trust, prosím vezměte na vědomí, že informace uvedené na této stránce nejsou určeny a neměly by být vykládány jako právní, daňové, investiční, finanční nebo jakékoli jiné formy poradenství. Je důležité investovat jen to, co si můžete dovolit ztratit, a v případě pochybností vyhledat nezávislé finanční poradenství. Pro další informace doporučujeme nahlédnout do smluvních podmínek a také na stránky nápovědy a podpory poskytnuté vydavatelem nebo inzerentem. MetaversePost se zavázala poskytovat přesné a nezaujaté zprávy, ale podmínky na trhu se mohou bez upozornění změnit.
O autorovi
Kumar je zkušený technický novinář se specializací na dynamické průniky AI/ML, marketingové technologie a nově vznikající obory, jako jsou kryptoměny, blockchain a NFTs. S více než 3 lety zkušeností v oboru si Kumar vytvořil prokazatelné výsledky ve vytváření působivých příběhů, vedení zasvěcených rozhovorů a poskytování komplexních poznatků. Kumarova odbornost spočívá ve vytváření vysoce působivého obsahu, včetně článků, zpráv a výzkumných publikací pro prominentní průmyslové platformy. Díky jedinečné sadě dovedností, které kombinují technické znalosti a vyprávění příběhů, Kumar vyniká v komunikaci složitých technologických konceptů pro různé publikum jasným a poutavým způsobem.
Další článkyKumar je zkušený technický novinář se specializací na dynamické průniky AI/ML, marketingové technologie a nově vznikající obory, jako jsou kryptoměny, blockchain a NFTs. S více než 3 lety zkušeností v oboru si Kumar vytvořil prokazatelné výsledky ve vytváření působivých příběhů, vedení zasvěcených rozhovorů a poskytování komplexních poznatků. Kumarova odbornost spočívá ve vytváření vysoce působivého obsahu, včetně článků, zpráv a výzkumných publikací pro prominentní průmyslové platformy. Díky jedinečné sadě dovedností, které kombinují technické znalosti a vyprávění příběhů, Kumar vyniká v komunikaci složitých technologických konceptů pro různé publikum jasným a poutavým způsobem.