Bhavish Aggarwal d'Ola dévoile un LLM « Krutrim » pour le développement de l'IA en langues indiennes
En bref
Le fondateur d'Ola, Bhavish Aggarwal, a présenté Krutrim, un LLM capable d'écrire des histoires, des poèmes et bien plus encore dans plusieurs langues indiennes.
La société indienne d'intelligence artificielle Krutrim Si Designs a présenté Krutrim, un grand modèle de langage (LLM) qui peut écrire des histoires, des poèmes et bien plus encore dans plusieurs langues indiennes.
La société Krutrim Si Designs a été lancée en avril 2023 et est dirigée par Bhavish Aggarwal, fondateur et PDG de la société indienne de covoiturage Ola.
Aggarwal a présenté Krutrim – qui signifie artificiel en sanskrit – lors d'un événement hybride diffusé en direct sur YouTube en deux tailles.
Un modèle de base nommé Krutrim a été formé sur deux mille milliards d'éléments de conversation (jetons) et d'ensembles de données. Il peut comprendre 20 Langues indiennes et peut même répondre dans 10 de ces langues, dont l'hindi, le marathi, le telugu, le kannada et plus encore.
De plus, Krutrim Pro, un autre modèle d'IA multimodal, devrait sortir en 2024 et promet des capacités de résolution de problèmes et d'exécution de tâches plus sophistiquées.
Selon l'annonce, le Krutrim Modèle IA est conçu pour répondre aux besoins uniques du contexte indien et représente un pas vers l’autosuffisance technologique et l’assimilation culturelle.
« Aujourd’hui, tous les modèles d’IA, appelés LLM, sont formés en grande partie en anglais, mais la langue n’est pas seulement du texte. La langue est également le véhicule des valeurs culturelles, du contexte et de l'éthique, et ses modèles d'IA actuels ne peuvent tout simplement pas capturer la culture, les connaissances et les aspirations de l'Inde, compte tenu de notre héritage multiculturel et multilingue », a déclaré Aggarwal.
Il a en outre ajouté que la mission du modèle est de façonner une Inde culturellement expressive, en s'orientant vers une économie axée sur l'IA et en remettant en question les paradigmes mondiaux.
Ravi Jain, directeur du marketing d'Ola, a mis en lumière l'architecture du modèle, déclarant que Krutrim possède de nombreuses innovations et représente le plus grand ensemble de données utilisé dans la formation. Positionné comme un modèle offrant le juste équilibre entre performances et prix, il devrait alimenter une myriade d’applications de bases de données.
Nous sommes prêts! L'IA de l'Inde, le voyage commence aujourd'hui ! Rejoignez-nous ici. https://t.co/eyBeiOTKgB
– Bhavish Aggarwal (@bhash) 15 décembre 2023
Les joueurs indiens courent pour les LLM dans la langue locale
L'équipe Krutrim affirme que le modèle d'IA surpasse GPT-4 en prise en charge de la langue indienne. La capacité du modèle à comprendre et à générer des résultats dans 20 langues indiennes, surpassant ainsi ses homologues mondiaux, le positionne comme un favori dans la course à l'IA.
Pour rendre Krutrim accessible au public, Ola a annoncé le lancement du site Web du modèle Krutrim AI. Les utilisateurs intéressés peuvent manifester leur intérêt à l’aide de leur numéro de téléphone, avec la promesse d’être informés dès que le chatbot sera disponible.
Aggarwal avait précédemment souligné que Krutrim serait une entreprise d'IA adaptée aux clients indiens, tirant parti des riches ressources de données disponibles dans le pays.
Récemment, une autre startup indienne d'IA générative, Sarvam AI, a publié OpenHathi-Salut-v0.1, le premier modèle linguistique hindi (LLM) de la série OpenHathi, une semaine après avoir levé 41 millions de dollars lors de son cycle de financement de série A mené par Lightspeed Ventures.
Selon Sarvam AI, l'objectif de la série OpenHathi est de contribuer au développement de modèles et d'ensembles de données ouverts pour promouvoir l'innovation dans l'IA en langue indienne et collabore avec des partenaires universitaires d'AI4Bharat, qui ont fourni des ressources linguistiques et des références pour cette initiative.
L'Inde a également dévoilé BharatGPT, une solution basée sur LLM créée en collaboration avec la startup indienne d'IA conversationnelle, CoRover.ai. Positionné comme une réponse à l'IA générative et aux LLM actuels, BharatGPT vise à combler un vide important sur le marché en proposant une solution autochtone. Il est disponible dans plus de 12 langues indiennes et prend en charge les interactions sur les plateformes vidéo, vocales et textuelles.
Il sera intéressant de voir comment ces LLM indiens locaux perturberont les industries, car ils pourraient ouvrir la porte à un intérêt accru pour cet espace dans le monde entier.
Clause de non-responsabilité
En ligne avec la Lignes directrices du projet de confiance, veuillez noter que les informations fournies sur cette page ne sont pas destinées à être et ne doivent pas être interprétées comme des conseils juridiques, fiscaux, d'investissement, financiers ou toute autre forme de conseil. Il est important d’investir uniquement ce que vous pouvez vous permettre de perdre et de demander des conseils financiers indépendants en cas de doute. Pour plus d'informations, nous vous suggérons de vous référer aux conditions générales ainsi qu'aux pages d'aide et de support mises à disposition par l'émetteur ou l'annonceur. MetaversePost s'engage à fournir des rapports précis et impartiaux, mais les conditions du marché sont susceptibles de changer sans préavis.
A propos de l'auteur
Kumar est un journaliste technologique expérimenté spécialisé dans les intersections dynamiques de l'IA/ML, de la technologie marketing et des domaines émergents tels que la cryptographie, la blockchain et NFTsFort de plus de 3 ans d'expérience dans le secteur, Kumar a fait ses preuves en matière d'élaboration de récits convaincants, de conduite d'entretiens approfondis et de fourniture d'informations complètes. L'expertise de Kumar réside dans la production de contenu à fort impact, notamment des articles, des rapports et des publications de recherche pour des plateformes industrielles de premier plan. Doté d'un ensemble de compétences uniques qui combine connaissances techniques et narration, Kumar excelle dans la communication de concepts technologiques complexes à des publics divers de manière claire et engageante.
Plus d'articles
Kumar est un journaliste technologique expérimenté spécialisé dans les intersections dynamiques de l'IA/ML, de la technologie marketing et des domaines émergents tels que la cryptographie, la blockchain et NFTsFort de plus de 3 ans d'expérience dans le secteur, Kumar a fait ses preuves en matière d'élaboration de récits convaincants, de conduite d'entretiens approfondis et de fourniture d'informations complètes. L'expertise de Kumar réside dans la production de contenu à fort impact, notamment des articles, des rapports et des publications de recherche pour des plateformes industrielles de premier plan. Doté d'un ensemble de compétences uniques qui combine connaissances techniques et narration, Kumar excelle dans la communication de concepts technologiques complexes à des publics divers de manière claire et engageante.



