Novinky Technika
13. prosince 2023

Sarvam AI vydává první indickou hindskou LLM „OpenHathi“, týden poté, co získala 41 milionů dolarů

Stručně

OpenHathi společnosti Sarvam AI je první hindský LLM zaměřený na vývoj otevřených modelů a datových sad, aby podporoval inovace AI pro indické jazyky.

Sarvam AI vydává první indickou hindskou LLM „OpenHathi“, týden poté, co získala 41 milionů dolarů

Indické spuštění generativní umělé inteligence Sarvam AI propuštěn OpenHathi-Hi-v0.1, první model velkého jazyka hindštiny (LLM) v sérii OpenHathi, jen týden poté zvyšování $ 41 milionů ve svém kole financování série A vedeném společností Lightspeed Ventures.

Hindština je nejrozšířenějším jazykem Indie, více než 43 % obyvatel ji deklaruje jako svůj mateřský jazyk. Model je postaven na Meta AI Llama2-7B architektura a poskytuje výkon na stejné úrovni GPT-3.5 pro indické jazyky.

„Ukazujeme, že náš model funguje stejně dobře, ne-li lépe než GPT-3.5 na různé úkoly v hindštině při zachování své anglické výkonnosti,“ uvedla společnost na platformě sociálních médií X (dříve Twitter).

Podle Sarvam AI je cílem série OpenHathi přispět k vývoji otevřených modelů a datových sad na podporu inovací v AI v indickém jazyce a spolupracuje s akademickými partnery v AI4Bharat, kteří pro tuto iniciativu poskytli jazykové zdroje a měřítka.

AI4Bharat je výzkumná laboratoř na Indian Institute of Technology (IIT) Madras – veřejné technické univerzitě v Indii, která pracuje na vývoji open source datových sad, nástrojů, modelů a aplikací pro indické jazyky.

OpenHathi používá rozšíření o 48,000 XNUMX tokenech LlamaTokenizer 2-7B a prochází dvoufázovým tréninkovým procesem. V první fázi se model soustředí na zarovnání vložení, zarovnání náhodně inicializovaných hindských vložení. Druhá fáze zahrnuje bilingvální jazykové modelování, kdy se model učí mezijazyčné pozornosti napříč tokeny.

Plnohodnotná generativní platforma AI bude spuštěnaed Soo

Společnost dále povzbuzuje lidi, aby byli kreativní a přicházeli s novými nápady pomocí a vylepšení této verze. Společnost zve vývojáře, aby vytvořili specializované modely pro různé účely s použitím modelu OpenHathi-Hi-v0.1 jako výchozího bodu.

Sarvam AI také plánuje vydat pokročilé modely pro podniky na svém komplexním generativní AI platforma, která bude podle startupu brzy spuštěna.

Při navyšování svých finančních prostředků pro sérii A společnost oznámila svůj plán vyvinout „kompletní sadu“ pro generativní umělou inteligenci, od inovací vedených výzkumem při trénování vlastních modelů umělé inteligence až po podnikovou platformu pro vytváření a nasazení.

Společnost dodala, že tento komplexní přístup urychlí přijetí generativní umělé inteligence v Indii, zejména vzhledem k tomu, že podniky vidí potenciál, ale řeší, jak jej využít pro své podnikání.

Založena v červenci 2023 Vivek Raghavan a Pratyush Kumar, dříve pracovala v AI4Bharat – podporovaná spoluzakladatelem Infosys Nandanem Nilekanim.

Nedávno Indie spustila BharatGPT, řešení založené na LLM vyvinuté ve spolupráci s indickým startupem CoRover.ai zaměřeným na konverzační umělou inteligenci, které je umístěno jako odpověď na existující generativní AI nebo LLM. Má v úmyslu zaplnit kritickou mezeru na trhu tím, že poskytne domácí řešení dostupné ve více než 12 indických jazycích, které zahrnuje video, hlas a textové interakce.

Odmítnutí odpovědnosti

V souladu s Pokyny k projektu Trust, prosím vezměte na vědomí, že informace uvedené na této stránce nejsou určeny a neměly by být vykládány jako právní, daňové, investiční, finanční nebo jakékoli jiné formy poradenství. Je důležité investovat jen to, co si můžete dovolit ztratit, a v případě pochybností vyhledat nezávislé finanční poradenství. Pro další informace doporučujeme nahlédnout do smluvních podmínek a také na stránky nápovědy a podpory poskytnuté vydavatelem nebo inzerentem. MetaversePost se zavázala poskytovat přesné a nezaujaté zprávy, ale podmínky na trhu se mohou bez upozornění změnit.

O autorovi

Kumar je zkušený technický novinář se specializací na dynamické průniky AI/ML, marketingové technologie a nově vznikající obory, jako jsou kryptoměny, blockchain a NFTs. S více než 3 lety zkušeností v oboru si Kumar vytvořil prokazatelné výsledky ve vytváření působivých příběhů, vedení zasvěcených rozhovorů a poskytování komplexních poznatků. Kumarova odbornost spočívá ve vytváření vysoce působivého obsahu, včetně článků, zpráv a výzkumných publikací pro prominentní průmyslové platformy. Díky jedinečné sadě dovedností, které kombinují technické znalosti a vyprávění příběhů, Kumar vyniká v komunikaci složitých technologických konceptů pro různé publikum jasným a poutavým způsobem.

Další články
Kumar Gandharv
Kumar Gandharv

Kumar je zkušený technický novinář se specializací na dynamické průniky AI/ML, marketingové technologie a nově vznikající obory, jako jsou kryptoměny, blockchain a NFTs. S více než 3 lety zkušeností v oboru si Kumar vytvořil prokazatelné výsledky ve vytváření působivých příběhů, vedení zasvěcených rozhovorů a poskytování komplexních poznatků. Kumarova odbornost spočívá ve vytváření vysoce působivého obsahu, včetně článků, zpráv a výzkumných publikací pro prominentní průmyslové platformy. Díky jedinečné sadě dovedností, které kombinují technické znalosti a vyprávění příběhů, Kumar vyniká v komunikaci složitých technologických konceptů pro různé publikum jasným a poutavým způsobem.

Institucionální apetit roste směrem k bitcoinovým ETF uprostřed volatility

Zveřejnění prostřednictvím podání 13F odhaluje, že pozoruhodní institucionální investoři fušují do bitcoinových ETF, což podtrhuje rostoucí akceptaci...

Vědět více

Přichází den odsouzení: Osud CZ visí v rovnováze, protože americký soud zvažuje žalobu ministerstva spravedlnosti

Changpeng Zhao je dnes připraven čelit rozsudku u amerického soudu v Seattlu.

Vědět více
Připojte se k naší komunitě inovativních technologií
Více
Dozvědět se více
Posun Donalda Trumpa ke kryptoměnám: od oponenta k obhájci a co to znamená pro americký trh s kryptoměnami
Business Trhy Příběhy a recenze Technika
Posun Donalda Trumpa ke kryptoměnám: od oponenta k obhájci a co to znamená pro americký trh s kryptoměnami
10
Layer3 spustí letos v létě token L3 a přidělí komunitě 51 % celkové dodávky
Trhy Novinky Technika
Layer3 spustí letos v létě token L3 a přidělí komunitě 51 % celkové dodávky
10
Poslední varování Edwarda Snowdena pro vývojáře bitcoinů: „Udělejte ze soukromí prioritu na úrovni protokolu nebo riskujte jeho ztrátu
Trhy Bezpečnost Wiki Vývoj Příběhy a recenze Technika
Poslední varování Edwarda Snowdena pro vývojáře bitcoinů: „Udělejte ze soukromí prioritu na úrovni protokolu nebo riskujte jeho ztrátu
10
Optimismem poháněná síť Ethereum Layer 2 Network Mint spustí svou hlavní síť 15. května
Novinky Technika
Optimismem poháněná síť Ethereum Layer 2 Network Mint spustí svou hlavní síť 15. května
10
CRYPTOMERIA LABS PTE. LTD.