05. Juni 2023

LLaMa mit 7 Milliarden Parametern ermöglicht blitzschnelle Inferenz auf dem Apple M2 Max Chip

Veröffentlicht: 05. Juni 2023 um 7:20 Uhr. Aktualisiert: 05. Juni 2023 um 7:21 Uhr

Bearbeitet und faktengeprüft: 05. Juni 2023 um 7:20 Uhr

In Kürze

LLaMa Das Modell läuft mit 40 Token pro Sekunde auf dem M2 Max-Chip, weist eine CPU-Auslastung von 0 % auf und regt die Fantasie von KI-Enthusiasten und Benutzern an.

KI-Modelle können auf individuelle Bedürfnisse zugeschnitten und lokal auf persönlichen Geräten ausgeführt werden, um personalisierte Unterstützung zu bieten und Routineaufgaben zu rationalisieren.

Eine bahnbrechende Errungenschaft auf dem Gebiet der KI wurde vorgestellt LLaMa Modell mit erstaunlichen 7 Milliarden Parametern läuft jetzt mit einer beeindruckenden Geschwindigkeit von 40 Token pro Sekunde auf einem MacBook, das mit dem hochmodernen M2 Max-Chip ausgestattet ist. Möglich wurde diese bemerkenswerte Leistung durch ein kürzlich durchgeführtes Update des GIT-Repositorys von Greganow, der die Modellinferenz erfolgreich implementiert hat Metall-GPU, ein spezialisierter Beschleuniger, der in den neuesten Chips von Apple zu finden ist.

LLaMa mit 7 Milliarden Parametern ermöglicht blitzschnelle Inferenz auf dem Apple M2 Max Chip — Kredit: Metaverse Post (mpost.io)

Empfohlen: Guanaco entwickelt sich zu einer potenziellen Open-Source-Quelle ChatGPT Wettbewerber

Die Implementierung der Modellinferenz auf der Metal-GPU hat zu außergewöhnlichen Ergebnissen geführt. Unter Verwendung dieser speziellen Hardware kann das LLaMa Das Modell weist eine erstaunliche CPU-Auslastung von 0 % auf und nutzt die Rechenleistung aller 38 Metallkerne effektiv aus. Dieser Erfolg stellt nicht nur die Fähigkeiten des Modells unter Beweis, sondern unterstreicht auch die außergewöhnlichen Fähigkeiten und das Fachwissen von Greganov als bemerkenswertem Ingenieur.

Die Auswirkungen dieser Entwicklung sind weitreichend und beflügeln die Fantasie von KI-Enthusiasten und -Anwendern gleichermaßen. Mit personalisiert LLaMa Mit lokal ausgeführten Modellen könnten Routineaufgaben mühelos von Einzelpersonen bewältigt werden, was eine neue Ära von einläutet Modularisierung. Das Konzept dreht sich um a massives Modell trainiert zentral, die dann von jedem Benutzer anhand seiner persönlichen Daten fein abgestimmt und angepasst wird, was zu einem hochgradig personalisierten und effizienten KI-Assistenten führt.

Die Vision einer personalisierten LLaMa Das Modell, Menschen bei alltäglichen Angelegenheiten zu unterstützen, birgt ein enormes Potenzial. Durch die Lokalisierung des Modells auf persönlichen Geräten können Benutzer gleichzeitig die Vorteile leistungsstarker KI erleben die Kontrolle über ihre Daten behalten. Diese Lokalisierung gewährleistet zudem schnelle Reaktionszeiten und ermöglicht eine schnelle und nahtlose Interaktion mit dem KI-Assistenten.

Die Kombination aus riesigen Modellgrößen und effizienter Inferenz auf spezieller Hardware ebnet den Weg für eine Zukunft, in der KI zu einem integralen Bestandteil des Lebens der Menschen wird, personalisierte Unterstützung bietet und Routineaufgaben rationalisiert.

Fortschritte wie diese bringen uns der Verwirklichung einer Welt näher, in der KI-Modelle auf individuelle Bedürfnisse zugeschnitten und lokal auf persönlichen Geräten ausgeführt werden können. Jeder Benutzer hat die Möglichkeit, seine Daten zu verfeinern und zu optimieren LLaMa Modell basierend auf ihren einzigartigen Daten, das Potenzial für KI-gesteuerte Effizienz und Produktivität ist grenzenlos.

Die Erfolge, die in der LLaMa Die Leistung des Modells auf dem Apple M2 Max-Chip ist ein Beweis dafür schneller Fortschritt in der KI-Forschung und -Entwicklung gemacht werden. Mit engagierten Ingenieuren wie Greganov, die die Grenzen des Möglichen verschieben, verspricht die Zukunft eine personalisierte, effiziente und lokal geführte Lösung KI-Modelle, die den Weg verändern werden Wir interagieren mit Technologie.

Lesen Sie mehr über KI:

Stichworte:

Haftungsausschluss

Im Einklang mit der Richtlinien des Trust-ProjektsBitte beachten Sie, dass die auf dieser Seite bereitgestellten Informationen nicht als Rechts-, Steuer-, Anlage-, Finanz- oder sonstige Beratung gedacht sind und nicht als solche interpretiert werden sollten. Es ist wichtig, nur so viel zu investieren, wie Sie sich leisten können, zu verlieren, und im Zweifelsfall eine unabhängige Finanzberatung einzuholen. Für weitere Informationen empfehlen wir einen Blick auf die Allgemeinen Geschäftsbedingungen sowie die Hilfe- und Supportseiten des Herausgebers oder Werbetreibenden. MetaversePost ist einer genauen, unvoreingenommenen Berichterstattung verpflichtet, die Marktbedingungen können sich jedoch ohne Vorankündigung ändern.

Über den Autor

Damir ist Teamleiter, Produktmanager und Redakteur bei Metaverse Post, behandelt Themen wie KI/ML, AGI, LLMs, Metaverse und Web3-bezogene Felder. Seine Artikel ziehen jeden Monat ein riesiges Publikum von über einer Million Nutzern an. Er scheint ein Experte mit 10 Jahren Erfahrung in SEO und digitalem Marketing zu sein. Damir wurde in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto und andere Publikationen. Als digitaler Nomade reist er zwischen den Vereinigten Arabischen Emiraten, der Türkei, Russland und der GUS. Damir hat einen Bachelor-Abschluss in Physik, der ihm seiner Meinung nach die Fähigkeiten zum kritischen Denken vermittelt hat, die er braucht, um in der sich ständig verändernden Landschaft des Internets erfolgreich zu sein.

Injective schließt sich mit AltLayer zusammen, um inEVM erneut Sicherheit zu bieten

by Alisa Davidson

03. Mai 2024

Masa arbeitet mit Teller zusammen, um den MASA-Kreditpool einzuführen, der die USDC-Kreditaufnahme auf Basis ermöglicht

by Alisa Davidson

03. Mai 2024

Velodrome bringt in den kommenden Wochen die Beta-Version von Superchain auf den Markt und weitet sich auf OP-Stack-Layer-2-Blockchains aus

by Alisa Davidson

03. Mai 2024

CARV gibt Partnerschaft mit Aethir bekannt, um seine Datenschicht zu dezentralisieren und Belohnungen zu verteilen

by Alisa Davidson

03. Mai 2024

Aktuelles

Injective schließt sich mit AltLayer zusammen, um inEVM erneut Sicherheit zu bieten

by Alisa Davidson

03. Mai 2024

Masa arbeitet mit Teller zusammen, um den MASA-Kreditpool einzuführen, der die USDC-Kreditaufnahme auf Basis ermöglicht

by Alisa Davidson

03. Mai 2024

Velodrome bringt in den kommenden Wochen die Beta-Version von Superchain auf den Markt und weitet sich auf OP-Stack-Layer-2-Blockchains aus

by Alisa Davidson

03. Mai 2024

CARV gibt Partnerschaft mit Aethir bekannt, um seine Datenschicht zu dezentralisieren und Belohnungen zu verteilen

by Alisa Davidson

03. Mai 2024

Angesichts der Volatilität wächst der institutionelle Appetit auf Bitcoin-ETFs

Offenlegungen in 13F-Anmeldungen zeigen, dass namhafte institutionelle Anleger sich mit Bitcoin-ETFs beschäftigen, was die wachsende Akzeptanz von ... unterstreicht.

Weitere Informationen