Nachrichtenbericht schaffen
26. Februar 2026

Inception Labs bringt Mercury 2 auf den Markt, ein auf Diffusion basierendes Schlussfolgerungsmodell, das über 1,000 Token pro Sekunde erreicht.

In Kürze

Inception Labs hat Mercury 2 auf den Markt gebracht, ein auf Diffusion basierendes Schlussfolgerungsmodell, das über 1,000 Token pro Sekunde generieren kann und damit dreimal schneller ist als vergleichbare Modelle.

Inception Labs stellt Mercury 2 vor: Ein diffusionsbasiertes LLM, das über 1,000 Token pro Sekunde für KI-Anwendungen mit geringer Latenz liefert.

Inception Labs, ein KI-Startup, hat Mercury 2 auf den Markt gebracht, ein diffusionsbasiertes Large Language Model (LLM), das entwickelt wurde, um Schlussfolgerungsaufgaben in produktiven KI-Anwendungen deutlich zu beschleunigen. 

Im Gegensatz zu herkömmlichen autoregressiven Modellen, die Texte sequenziell generieren, verwendet Mercury 2 einen parallelen Verfeinerungsprozess, der mehrere Token gleichzeitig erzeugt und in wenigen Schritten konvergiert. Dadurch werden Geschwindigkeiten von über 1,000 Token pro Sekunde auf NVIDIA Blackwell GPUs erreicht – etwa dreimal schneller als bei Konkurrenzmodellen in der gleichen Preisklasse.

Das Modell ist für Echtzeit-Reaktionsfähigkeit in komplexen KI-Workflows optimiert, in denen sich Latenzzeiten durch mehrere Inferenzaufrufe, Abrufpipelines und Agentenschleifen summieren. Mercury 2 gewährleistet eine hohe Schlussfolgerungsqualität bei gleichzeitig reduzierter Latenz. Dadurch können Entwickler, Sprach-KI-Systeme, Suchmaschinen und andere interaktive Anwendungen mit optimaler Schlussfolgerungsleistung arbeiten, ohne die Verzögerungen sequenzieller Generierung in Kauf nehmen zu müssen. Es unterstützt Funktionen wie anpassbare Schlussfolgerungen, 128K-Token-Kontextfenster, schemakonforme JSON-Ausgabe und native Tool-Integration und bietet so Flexibilität für eine Vielzahl von Produktionsumgebungen.

Mercury 2 ermöglicht KI mit geringer Latenz in Codierungs-, Sprach- und Such-Workflows. 

Der Bericht hebt mehrere Anwendungsfälle hervor, in denen latenzarmes Schließen entscheidend ist. In Codierungs- und Bearbeitungsworkflows bietet Mercury 2 schnelle Autovervollständigung und Vorschläge für den nächsten Bearbeitungsschritt, die sich nahtlos in die Denkprozesse der Entwickler integrieren. In agentenbasierten Workflows ermöglicht das Modell mehr Inferenzschritte, ohne die Latenzgrenzen zu überschreiten, und verbessert so die Qualität und Tiefe der automatisierten Entscheidungsfindung. Sprachbasierte KI und interaktive Anwendungen profitieren von der Fähigkeit, in natürlicher Sprachmelodie Antworten in hoher Schlussfolgerungsqualität zu generieren und so das Nutzererlebnis in Echtzeit-Konversationsszenarien zu optimieren. Darüber hinaus unterstützt Mercury 2 mehrstufige Such- und Abrufprozesse und ermöglicht so schnelle Zusammenfassung, Neubewertung und Schlussfolgerung ohne Beeinträchtigung der Reaktionszeiten.

Erste Anwender berichten von deutlichen Verbesserungen bei Durchsatz und Benutzerfreundlichkeit. Mercury 2 soll mindestens doppelt so schnell sein wie GPT-5.2 bei gleichzeitiger Beibehaltung wettbewerbsfähiger Qualität, mit Anwendungen, die von Echtzeit-Transkriptbereinigung über interaktive Mensch-Computer-Schnittstellen und autonome Werbeoptimierung bis hin zu sprachgesteuerten KI-Avataren reichen.

Das Modell ist kompatibel mit dem OpenAI Die API ermöglicht die Integration in bestehende Systeme ohne umfangreiche Anpassungen, und Inception Labs bietet Unterstützung für Unternehmensbewertungen, Leistungsvalidierung und workloadspezifische Bereitstellungshinweise. Mercury 2 stellt einen Fortschritt bei diffusionsbasierten LLMs dar.defiDas Gleichgewicht zwischen Argumentationsqualität und Latenz in produktiven KI-Umgebungen finden.

Haftungsausschluss

Im Einklang mit der Richtlinien des Trust-ProjektsBitte beachten Sie, dass die auf dieser Seite bereitgestellten Informationen nicht als Rechts-, Steuer-, Anlage-, Finanz- oder sonstige Beratung gedacht sind und nicht als solche interpretiert werden sollten. Es ist wichtig, nur so viel zu investieren, wie Sie sich leisten können, zu verlieren, und im Zweifelsfall eine unabhängige Finanzberatung einzuholen. Für weitere Informationen empfehlen wir einen Blick auf die Allgemeinen Geschäftsbedingungen sowie die Hilfe- und Supportseiten des Herausgebers oder Werbetreibenden. MetaversePost ist einer genauen, unvoreingenommenen Berichterstattung verpflichtet, die Marktbedingungen können sich jedoch ohne Vorankündigung ändern.

Über den Autor

Alisa, eine engagierte Journalistin bei der MPost, ist spezialisiert auf Krypto, KI, Investitionen und das weitreichende Gebiet von Web3. Mit einem scharfen Blick für neue Trends und Technologien liefert sie eine umfassende Berichterstattung, um die Leser über die sich ständig weiterentwickelnde Landschaft des digitalen Finanzwesens zu informieren und einzubeziehen.

Weitere Artikel
Alisa Davidson
Alisa Davidson

Alisa, eine engagierte Journalistin bei der MPost, ist spezialisiert auf Krypto, KI, Investitionen und das weitreichende Gebiet von Web3. Mit einem scharfen Blick für neue Trends und Technologien liefert sie eine umfassende Berichterstattung, um die Leser über die sich ständig weiterentwickelnde Landschaft des digitalen Finanzwesens zu informieren und einzubeziehen.

Hot Stories
Abonnieren Sie unseren Newsletter.
Aktuelle News

Die Ruhe vor dem Solana-Sturm: Was Charts, Wale und On-Chain-Signale jetzt sagen

Solana hat eine starke Leistung gezeigt, die auf die zunehmende Akzeptanz, das institutionelle Interesse und wichtige Partnerschaften zurückzuführen ist, während es gleichzeitig mit potenziellen ... konfrontiert ist.

Mehr Erfahren

Krypto im April 2025: Wichtige Trends, Veränderungen und was als nächstes kommt

Im April 2025 konzentrierte sich der Kryptobereich auf die Stärkung der Kerninfrastruktur, wobei sich Ethereum auf Pectra vorbereitete ...

Mehr Erfahren
MEHR LESEN
Weiterlesen
Oxford AI erkennt frühzeitig das Risiko einer Herzinsuffizienz anhand von routinemäßigen CT-Scans mit einer Genauigkeit von 86 % bei 72,000 Patienten.
Meinung schaffen
Oxford AI erkennt frühzeitig das Risiko einer Herzinsuffizienz anhand von routinemäßigen CT-Scans mit einer Genauigkeit von 86 % bei 72,000 Patienten.
10. April 2026
Perplexity integriert Plaid und verwandelt seinen KI-„Computer“-Agenten in ein Zentrum für persönliche Finanzen.
Nachrichtenbericht schaffen
Perplexity integriert Plaid und verwandelt seinen KI-„Computer“-Agenten in ein Zentrum für persönliche Finanzen.
10. April 2026
Inside Hack Seasons Konferenz Cannes: Experten enthüllen operative Erkenntnisse vom Testnetz zum Hauptnetz
Hacken Sie Jahreszeiten Interview Geschäft Lifestyle
Inside Hack Seasons Konferenz Cannes: Experten enthüllen operative Erkenntnisse vom Testnetz zum Hauptnetz
10. April 2026
DISCO durchbricht die Barriere des Enzymdesigns und erzeugt Proteine ​​ohne Äquivalent in der Natur
Meinung schaffen
DISCO durchbricht die Barriere des Enzymdesigns und erzeugt Proteine ​​ohne Äquivalent in der Natur
10. April 2026
CRYPTOMERIA LABS PTE. GMBH.