Nieuwsverslag Technologie
13 december 2023

Sarvam AI brengt India's eerste Hindi LLM 'OpenHathi' uit, een week nadat hij $ 41 miljoen heeft opgehaald

In het kort

OpenHathi van Sarvam AI is de eerste Hindi LLM gericht op de ontwikkeling van open modellen en datasets, om AI-innovatie voor Indiase talen te bevorderen.

Sarvam AI brengt India's eerste Hindi LLM 'OpenHathi' uit, een week nadat hij $ 41 miljoen heeft opgehaald

Indiase generatieve AI-startup Sarvam AI uitgebracht OpenHathi-Hi-v0.1, het eerste Hindi grote taalmodel (LLM) in de OpenHathi-serie, slechts een week later het verhogen van $ 41 miljoen in zijn Series A-financieringsronde onder leiding van Lightspeed Ventures.

Hindi is de meest gesproken taal van India; ruim 43% van de bevolking noemt het hun moedertaal. Het model is gebouwd op Meta AI's Llama2-7B-architectuur en levert prestaties die vergelijkbaar zijn met GPT-3.5 voor Indische talen.

“We laten zien dat ons model net zo goed werkt, zo niet beter dan GPT-3.5 op verschillende Hindi-taken met behoud van de Engelse prestaties”, aldus het bedrijf op sociale mediaplatform X (voorheen Twitter).

Volgens Sarvam AI is het doel van de OpenHathi-serie om bij te dragen aan de ontwikkeling van open modellen en datasets om innovatie op het gebied van Indiase taal AI en werkt samen met academische partners bij AI4Bharat, die taalbronnen en benchmarks voor dit initiatief hebben geleverd.

AI4Bharat is een onderzoekslaboratorium aan het Indian Institute of Technology (IIT) Madras – een openbare technische universiteit in India, dat werkt aan de ontwikkeling van open-source datasets, tools, modellen en toepassingen voor Indiase talen.

OpenHathi gebruikt een extensie van 48,000 tokens van Llama2-7B's tokenizer en ondergaat een trainingsproces in twee stappen. In de eerste fase concentreert het model zich op de uitlijning van de inbedding, waarbij willekeurig geïnitialiseerde Hindi-inbeddingen op één lijn worden gebracht. De tweede fase omvat tweetalige taalmodellering, waarbij het model intertalige aandacht over tokens heen leert.

Er wordt een full-stack generatief AI-platform gelanceerded Soo

Verder moedigt het bedrijf mensen aan om creatief te zijn en met nieuwe ideeën te komen door deze release te gebruiken en te verbeteren. Het bedrijf nodigt ontwikkelaars uit om gespecialiseerde modellen voor verschillende doeleinden te bouwen, met het OpenHathi-Hi-v0.1-model als uitgangspunt.

Sarvam AI is ook van plan om geavanceerde modellen voor bedrijven op zijn uitgebreide platform uit te brengen generatieve AI platform, dat volgens de startup binnenkort gelanceerd zal worden.

Terwijl het zijn Series A-financiering ophaalde, kondigde het bedrijf zijn plan aan om de “full-stack” voor generatieve AI te ontwikkelen, variërend van door onderzoek geleide innovaties in het trainen van aangepaste AI-modellen tot een platform op ondernemingsniveau voor het schrijven en implementeren.

Het bedrijf voegde eraan toe dat deze full-stack-aanpak de adoptie van generatieve AI in India zal versnellen, vooral gezien het feit dat bedrijven het potentieel zien, maar worstelen met de manier waarop ze dit voor hun bedrijf kunnen inzetten.

Opgericht in juli 2023 door Vivek Raghavan en Pratyush Kumar, hebben eerder gewerkt bij AI4Bharat – ondersteund door Infosys mede-oprichter Nandan Nilekani.

Onlangs lanceerde India BharatGPT, een op LLM gebaseerde oplossing ontwikkeld in samenwerking met de Indiase conversatie AI-startup CoRover.ai, die is gepositioneerd als het antwoord op bestaande generatieve AI of LLM's. Het is van plan een kritiek gat in de markt op te vullen door een inheemse oplossing aan te bieden die beschikbaar is in meer dan twaalf Indiase talen, waaronder video-, stem- en tekstinteracties.

Disclaimer

In lijn met de Richtlijnen voor vertrouwensprojectenHoud er rekening mee dat de informatie op deze pagina niet bedoeld is en niet mag worden geïnterpreteerd als juridisch, fiscaal, beleggings-, financieel of enige andere vorm van advies. Het is belangrijk om alleen te beleggen wat u zich kunt veroorloven te verliezen en onafhankelijk financieel advies in te winnen als u twijfels heeft. Voor meer informatie raden wij u aan de algemene voorwaarden en de hulp- en ondersteuningspagina's van de uitgever of adverteerder te raadplegen. MetaversePost streeft naar nauwkeurige, onpartijdige berichtgeving, maar de marktomstandigheden kunnen zonder voorafgaande kennisgeving worden gewijzigd.

Over de auteur

Kumar is een ervaren technologiejournalist met een specialisatie in de dynamische kruispunten van AI/ML, marketingtechnologie en opkomende velden zoals crypto, blockchain en NFTS. Met meer dan drie jaar ervaring in de branche heeft Kumar een bewezen staat van dienst opgebouwd in het opstellen van boeiende verhalen, het houden van inzichtelijke interviews en het leveren van uitgebreide inzichten. De expertise van Kumar ligt in het produceren van inhoud met een grote impact, waaronder artikelen, rapporten en onderzoekspublicaties voor vooraanstaande industriële platforms. Met een unieke reeks vaardigheden die technische kennis en verhalen vertellen combineert, blinkt Kumar uit in het op een duidelijke en boeiende manier communiceren van complexe technologische concepten aan een divers publiek.

Meer artikelen
Kumar Gandharv
Kumar Gandharv

Kumar is een ervaren technologiejournalist met een specialisatie in de dynamische kruispunten van AI/ML, marketingtechnologie en opkomende velden zoals crypto, blockchain en NFTS. Met meer dan drie jaar ervaring in de branche heeft Kumar een bewezen staat van dienst opgebouwd in het opstellen van boeiende verhalen, het houden van inzichtelijke interviews en het leveren van uitgebreide inzichten. De expertise van Kumar ligt in het produceren van inhoud met een grote impact, waaronder artikelen, rapporten en onderzoekspublicaties voor vooraanstaande industriële platforms. Met een unieke reeks vaardigheden die technische kennis en verhalen vertellen combineert, blinkt Kumar uit in het op een duidelijke en boeiende manier communiceren van complexe technologische concepten aan een divers publiek.

Van Ripple tot The Big Green DAO: hoe cryptocurrency-projecten bijdragen aan liefdadigheid

Laten we initiatieven onderzoeken die het potentieel van digitale valuta voor goede doelen benutten.

Meer weten

AlphaFold 3, Med-Gemini en anderen: de manier waarop AI de gezondheidszorg transformeert in 2024

AI manifesteert zich op verschillende manieren in de gezondheidszorg, van het blootleggen van nieuwe genetische correlaties tot het versterken van robotchirurgische systemen...

Meer weten
Sluit u aan bij onze innovatieve technologiegemeenschap
Lees meer
Lees meer
Sophon lanceert Liquidity Farming en wijst 10% van het totale SOPH-tokenaanbod toe aan beloningsdeelnemers
markten Nieuwsverslag Technologie
Sophon lanceert Liquidity Farming en wijst 10% van het totale SOPH-tokenaanbod toe aan beloningsdeelnemers
18 June 2024
API3 introduceert Oracle Stack On Bitlayer voor verbeterde ontwikkelaarservaring
Nieuwsverslag Technologie
API3 introduceert Oracle Stack On Bitlayer voor verbeterde ontwikkelaarservaring
18 June 2024
Vervuiling beperken? Hoe de voormalige energievarkens van Bitcoin ernaar streven de koolstofbui van AI te stoppen
Advies Business markten Software Technologie
Vervuiling beperken? Hoe de voormalige energievarkens van Bitcoin ernaar streven de koolstofbui van AI te stoppen
18 June 2024
dForce introduceert gedecentraliseerde Stablecoin sUSX voor het verdienen van rendement en biedt gebruikers verbeterde liquiditeit
Nieuwsverslag Technologie
dForce introduceert gedecentraliseerde Stablecoin sUSX voor het verdienen van rendement en biedt gebruikers verbeterde liquiditeit
18 June 2024