Rapport de nouvelles Technologie
26 février 2026

Inception Labs lance Mercury 2, un modèle de raisonnement basé sur la diffusion atteignant plus de 1 000 jetons par seconde

En bref

Inception Labs a lancé Mercury 2, un modèle de raisonnement basé sur la diffusion capable de générer plus de 1 000 jetons par seconde, soit trois fois plus vite que les modèles comparables.

Inception Labs dévoile Mercury 2 : un LLM basé sur la diffusion, capable de fournir plus de 1 000 jetons par seconde pour les applications d’IA à faible latence.

Laboratoires Inception, une startup spécialisée dans l'IA, a lancé Mercury 2, un modèle de langage étendu (LLM) basé sur la diffusion, conçu pour accélérer considérablement les tâches de raisonnement dans les applications d'IA de production. 

Contrairement aux modèles autorégressifs traditionnels qui génèrent du texte de manière séquentielle, Mercury 2 utilise un processus d'affinage parallèle, produisant plusieurs jetons simultanément et convergeant sur un petit nombre d'étapes, permettant des vitesses de plus de 1 000 jetons par seconde sur les GPU NVIDIA Blackwell, soit environ trois fois plus rapide que les modèles concurrents dans la même gamme de prix.

Le modèle est optimisé pour une réactivité en temps réel dans les flux de travail d'IA complexes, où la latence s'accumule lors des multiples appels d'inférence, pipelines de récupération et boucles d'agents. Mercury 2 maintient une haute qualité de raisonnement tout en réduisant la latence, permettant ainsi aux développeurs, aux systèmes d'IA vocale, aux moteurs de recherche et autres applications interactives de fonctionner avec des performances de raisonnement optimales sans les délais associés à la génération séquentielle. Il prend en charge des fonctionnalités telles que le raisonnement paramétrable, des fenêtres de contexte de jetons de 128 000, une sortie JSON alignée sur le schéma et l'intégration native d'outils, offrant une grande flexibilité pour divers déploiements en production.

Mercury 2 permet une IA à faible latence pour les flux de travail de codage, de voix et de recherche. 

Le rapport met en lumière plusieurs cas d'usage où un raisonnement à faible latence est essentiel. Dans les flux de travail de codage et d'édition, Mercury 2 propose des suggestions de saisie semi-automatique et de modification rapide, s'intégrant parfaitement au processus de réflexion des développeurs. Dans les flux de travail d'agents, le modèle permet d'effectuer davantage d'étapes d'inférence sans dépasser les limites de latence, améliorant ainsi la qualité et la profondeur de la prise de décision automatisée. L'IA vocale et les applications interactives bénéficient de sa capacité à générer des réponses de qualité, avec un débit de parole naturel, enrichissant l'expérience utilisateur lors de conversations en temps réel. De plus, Mercury 2 prend en charge les pipelines de recherche et d'extraction multi-étapes, permettant une synthèse, un réordonnancement et un raisonnement rapides sans impacter les temps de réponse.

Les premiers utilisateurs ont constaté des améliorations significatives en termes de débit et d'expérience utilisateur. Mercury 2 a été décrit comme étant au moins deux fois plus rapide que GPT-5.2 tout en maintenant une qualité compétitive, avec des applications couvrant le nettoyage de transcriptions en temps réel, les interfaces homme-machine interactives, l'optimisation publicitaire autonome et les avatars d'IA à commande vocale.

Le modèle est compatible avec le OpenAI L'API permet l'intégration aux infrastructures existantes sans modification majeure, et Inception Labs propose un accompagnement pour les évaluations d'entreprise, la validation des performances et des conseils de déploiement spécifiques aux charges de travail. Mercury 2 représente une avancée dans les LLM basés sur la diffusion.defiTrouver le juste équilibre entre la qualité du raisonnement et la latence dans les environnements d'IA de production.

Clause de non-responsabilité

En ligne avec la Lignes directrices du projet de confiance, veuillez noter que les informations fournies sur cette page ne sont pas destinées à être et ne doivent pas être interprétées comme des conseils juridiques, fiscaux, d'investissement, financiers ou toute autre forme de conseil. Il est important d’investir uniquement ce que vous pouvez vous permettre de perdre et de demander des conseils financiers indépendants en cas de doute. Pour plus d'informations, nous vous suggérons de vous référer aux conditions générales ainsi qu'aux pages d'aide et de support mises à disposition par l'émetteur ou l'annonceur. MetaversePost s'engage à fournir des rapports précis et impartiaux, mais les conditions du marché sont susceptibles de changer sans préavis.

A propos de l'auteur

Alisa, journaliste dévouée au MPost, se spécialise dans les cryptomonnaies, l'IA, les investissements et le vaste domaine de Web3. Avec un œil attentif sur les tendances et technologies émergentes, elle propose une couverture complète pour informer et impliquer les lecteurs dans le paysage en constante évolution de la finance numérique.

Plus d'articles
Alice Davidson
Alice Davidson

Alisa, journaliste dévouée au MPost, se spécialise dans les cryptomonnaies, l'IA, les investissements et le vaste domaine de Web3. Avec un œil attentif sur les tendances et technologies émergentes, elle propose une couverture complète pour informer et impliquer les lecteurs dans le paysage en constante évolution de la finance numérique.

Le calme avant la tempête Solana : ce que disent les cartes, les baleines et les signaux en chaîne

Solana a démontré de solides performances, portées par une adoption croissante, un intérêt institutionnel et des partenariats clés, tout en étant confrontée à un potentiel...

Savoir Plus

Cryptomonnaies en avril 2025 : tendances clés, évolutions et perspectives

En avril 2025, l'espace crypto s'est concentré sur le renforcement de l'infrastructure de base, Ethereum se préparant pour le Pectra...

Savoir Plus
Lire la suite
En savoir plus
Les 10 protocoles qui transformeront les cryptomonnaies en services bancaires courants en 2026
Top Listes Technologie
Les 10 protocoles qui transformeront les cryptomonnaies en services bancaires courants en 2026
le 20 avril 2026
L'IA rencontre DeFiPourquoi la cryptographie devient la couche d'exécution des agents intelligents
Rapport de nouvelles Technologie
L'IA rencontre DeFiPourquoi la cryptographie devient la couche d'exécution des agents intelligents
le 20 avril 2026
Bitget ouvre son programme d'introduction en bourse Prime à la souscription, élargissant l'accès aux opportunités pré-IPO
Rapport de nouvelles Technologie
Bitget ouvre son programme d'introduction en bourse Prime à la souscription, élargissant l'accès aux opportunités pré-IPO
le 20 avril 2026
Les agents d'IA s'améliorent rapidement, mais peinent encore à fonctionner dans le monde réel.
Rapport de nouvelles Technologie
Les agents d'IA s'améliorent rapidement, mais peinent encore à fonctionner dans le monde réel.
le 20 avril 2026
CRYPTOMERIA LABS PTE. LTD.