Nyheds rapport Teknologier
05. Juni, 2023

LLaMa med 7 milliarder parametre opnår lynhurtig konklusion på Apple M2 Max-chip

Kort sagt

LLaMa modellen kører med 40 tokens i sekundet på M2 Max-chippen, hvilket demonstrerer 0 % CPU-udnyttelse, og tænder fantasien hos AI-entusiaster og brugere.

AI-modeller kan skræddersyes til individuelle behov og køre lokalt på personlige enheder, hvilket giver personlig assistance og strømliner rutineopgaver.

En banebrydende præstation inden for kunstig intelligens er blevet afsløret som LLaMa model med forbløffende 7 milliarder parametre kører nu med en imponerende hastighed på 40 tokens i sekundet på en MacBook udstyret med den banebrydende M2 ​​Max-chip. Denne bemærkelsesværdige bedrift blev gjort mulig gennem en nylig opdatering til GIT-lageret af Greganov, der med succes implementerede modelinferens på Metal GPU, en specialiseret accelerator fundet i Apples seneste chips.

LLaMa med 7 milliarder parametre opnår lynhurtig konklusion på Apple M2 Max-chip
Credit: Metaverse Post (mpost.io)
Anbefales: Guanaco fremstår som en potentiel open source ChatGPT Konkurrent

Implementeringen af ​​modelinferens på Metal GPU'en har givet ekstraordinære resultater. Ved at bruge denne specielle hardware LLaMa modellen demonstrerer en forbløffende 0% CPU-udnyttelse, der effektivt udnytter processorkraften i alle 38 metalkerner. Denne præstation viser ikke kun modellens muligheder, men fremhæver også Greganovs enestående dygtighed og ekspertise som en bemærkelsesværdig ingeniør.

Implikationerne af denne udvikling er vidtrækkende og tænder fantasien hos AI-entusiaster og brugere. Med personlig LLaMa modeller, der kører lokalt, kunne rutineopgaver nemt administreres af enkeltpersoner, hvilket indvarsler en ny æra med modularisering. Konceptet drejer sig om en massiv model trænet centralt, som derefter finjusteres og tilpasses af hver bruger på deres personlige data, hvilket resulterer i en yderst personlig og effektiv AI-assistent.

Visionen om at have en personlig LLaMa model, der hjælper enkeltpersoner med dagligdags anliggender, rummer et enormt potentiale. Ved at lokalisere modellen på personlige enheder kan brugerne opleve fordelene ved kraftfuld AI, mens bevare kontrol over deres data. Denne lokalisering sikrer også hurtige svartider, hvilket muliggør hurtig og problemfri interaktion med AI-assistenten.

Kombinationen af ​​massive modelstørrelser og effektiv slutning om specialiseret hardware baner vejen for en fremtid, hvor AI bliver en integreret del af folks liv, giver personlig assistance og strømliner rutineopgaver.

Fremskridt som disse bringer os tættere på at realisere en verden, hvor AI-modeller kan skræddersyes til individuelle behov og køre lokalt på personlige enheder. Med hver bruger har mulighed for at forfine og optimere deres LLaMa model baseret på deres unikke data, er potentialet for AI-drevet effektivitet og produktivitet ubegrænset.

De præstationer, der er vidne til i LLaMa modellens ydeevne på Apple M2 Max-chippen tjener som et vidnesbyrd om hurtige fremskridt bliver lavet i AI-forskning og -udvikling. Med dedikerede ingeniører som Greganov, der skubber grænserne for, hvad der er muligt, lover fremtiden et personligt, effektivt og lokalt drevet AI-modeller, der vil transformere vejen vi interagerer med teknologi.

Læs mere om AI:

Ansvarsfraskrivelse

I tråd med den Trust Project retningslinjer, bemærk venligst, at oplysningerne på denne side ikke er beregnet til at være og ikke skal fortolkes som juridiske, skattemæssige, investeringsmæssige, finansielle eller nogen anden form for rådgivning. Det er vigtigt kun at investere, hvad du har råd til at tabe, og at søge uafhængig finansiel rådgivning, hvis du er i tvivl. For yderligere information foreslår vi at henvise til vilkårene og betingelserne samt hjælpe- og supportsiderne fra udstederen eller annoncøren. MetaversePost er forpligtet til nøjagtig, objektiv rapportering, men markedsforholdene kan ændres uden varsel.

Om forfatteren

Damir er teamleder, produktchef og redaktør på Metaverse Post, der dækker emner som AI/ML, AGI, LLM'er, Metaverse og Web3-relaterede felter. Hans artikler tiltrækker et massivt publikum på over en million brugere hver måned. Han ser ud til at være en ekspert med 10 års erfaring i SEO og digital markedsføring. Damir er blevet nævnt i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto og andre publikationer. Han rejser mellem UAE, Tyrkiet, Rusland og SNG som en digital nomade. Damir tog en bachelorgrad i fysik, som han mener har givet ham de kritiske tænkningskompetencer, der er nødvendige for at få succes i internettets evigt skiftende landskab. 

Flere artikler
Damir Yalalov
Damir Yalalov

Damir er teamleder, produktchef og redaktør på Metaverse Post, der dækker emner som AI/ML, AGI, LLM'er, Metaverse og Web3-relaterede felter. Hans artikler tiltrækker et massivt publikum på over en million brugere hver måned. Han ser ud til at være en ekspert med 10 års erfaring i SEO og digital markedsføring. Damir er blevet nævnt i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto og andre publikationer. Han rejser mellem UAE, Tyrkiet, Rusland og SNG som en digital nomade. Damir tog en bachelorgrad i fysik, som han mener har givet ham de kritiske tænkningskompetencer, der er nødvendige for at få succes i internettets evigt skiftende landskab. 

Hot Stories
Tilmeld dig vores nyhedsbrev.
Seneste Nyheder

Institutionel appetit vokser mod Bitcoin ETF'er midt i volatilitet

Afsløringer gennem 13F-arkivering afslører bemærkelsesværdige institutionelle investorer, der dytter i Bitcoin ETF'er, hvilket understreger en voksende accept af ...

Vide mere

Straffeudmålingsdagen ankommer: CZ's skæbne hænger i balance, da amerikansk domstol overvejer DOJ's anbringende

Changpeng Zhao står klar til at blive dømt ved en amerikansk domstol i Seattle i dag.

Vide mere
Tilmeld dig vores innovative teknologifællesskab
Læs mere
Læs mere
Injective slår sig sammen med AltLayer for at give inEVM genskabende sikkerhed
Forretning Nyheds rapport Teknologier
Injective slår sig sammen med AltLayer for at give inEVM genskabende sikkerhed
Maj 3, 2024
Masa går sammen med Teller for at introducere MASA Lending Pool, muliggør USDC-lån på base
Markeder Nyheds rapport Teknologier
Masa går sammen med Teller for at introducere MASA Lending Pool, muliggør USDC-lån på base
Maj 3, 2024
Velodrome lancerer Superchain Beta-version i de kommende uger og udvider på tværs af OP Stack Layer 2 Blockchains
Markeder Nyheds rapport Teknologier
Velodrome lancerer Superchain Beta-version i de kommende uger og udvider på tværs af OP Stack Layer 2 Blockchains
Maj 3, 2024
CARV annoncerer partnerskab med Aethir for at decentralisere sit datalag og uddele belønninger
Forretning Nyheds rapport Teknologier
CARV annoncerer partnerskab med Aethir for at decentralisere sit datalag og uddele belønninger
Maj 3, 2024