Buletin de stiri Tehnologia
05 Iunie, 2023

LLaMa cu 7 miliarde de parametri, realizează o inferență fulgerătoare pe chipul Apple M2 Max

Pe scurt

LLaMa modelul rulează cu 40 de jetoane pe secundă pe cipul M2 Max, demonstrând o utilizare de 0% a procesorului, aprinzând imaginația pasionaților și utilizatorilor de AI.

Modelele AI pot fi adaptate nevoilor individuale și pot rula local pe dispozitive personale, oferind asistență personalizată și simplificând sarcinile de rutină.

O realizare revoluționară în domeniul AI a fost dezvăluită drept LLaMa model cu 7 miliarde de parametri uimitoare acum rulează la o viteză impresionantă de 40 de jetoane pe secundă pe un MacBook echipat cu cip M2 Max de ultimă oră. Această performanță remarcabilă a fost posibilă printr-o actualizare recentă a depozitului GIT de către Greganov, care a implementat cu succes inferența modelului pe GPU metalic, un accelerator specializat găsit în cele mai recente cipuri Apple.

LLaMa cu 7 miliarde de parametri, realizează o inferență fulgerătoare pe chipul Apple M2 Max
Credit: Metaverse Post (mpost.io)
Recomandat: Guanaco apare ca o sursă deschisă potențială ChatGPT Concurent

Implementarea inferenței modelului pe metal GPU a dat rezultate extraordinare. Folosind acest hardware special, LLaMa modelul demonstrează o utilizare uimitoare a procesorului de 0%, valorificând eficient puterea de procesare a tuturor celor 38 de nuclee metalice. Această realizare nu numai că evidențiază capacitățile modelului, dar evidențiază și abilitățile și expertiza excepționale ale lui Greganov ca inginer remarcabil.

Implicațiile acestei dezvoltări sunt de anvergură, aprinzând imaginația pasionaților de AI și utilizatorilor deopotrivă. Cu personalizat LLaMa modele care rulează local, sarcinile de rutină ar putea fi gestionate fără efort de către indivizi, deschizând o nouă eră a modularizarea. Conceptul se învârte în jurul a model masiv antrenat central, care este apoi reglat și personalizat de către fiecare utilizator cu privire la datele sale personale, rezultând un asistent AI extrem de personalizat și eficient.

Viziunea de a avea un personalizat LLaMa modelul care asistă indivizii cu probleme de zi cu zi are un potențial imens. Prin localizarea modelului pe dispozitivele personale, utilizatorii pot experimenta beneficiile AI puternice în timp ce menținând controlul asupra datelor lor. Această localizare asigură, de asemenea, timpi de răspuns rapid, permițând interacțiuni rapide și fără întreruperi cu asistentul AI.

Combinația dintre dimensiunile masive de model și inferența eficientă asupra hardware-ului specializat deschide calea către un viitor în care AI devine o parte integrantă a vieții oamenilor, oferind asistență personalizată și simplificând sarcinile de rutină.

Progrese ca acestea ne aduc mai aproape de realizarea unei lumi în care modelele AI pot fi adaptate nevoilor individuale și pot fi rulate local pe dispozitive personale. Fiecare utilizator având capacitatea de a-și rafina și optimiza LLaMa model bazat pe datele lor unice, potențialul de eficiență și productivitate bazată pe inteligență artificială este nelimitat.

Realizările observate în LLaMa performanța modelului pe cipul Apple M2 Max servește ca o dovadă a progres rapid fiind realizate în cercetarea și dezvoltarea IA. Cu ingineri dedicați precum Greganov care depășesc limitele a ceea ce este posibil, viitorul este promițător pentru personalizare, eficientă și administrată local. Modele AI care vor transforma drumul interacționăm cu tehnologia.

Citiți mai multe despre AI:

Declinare a responsabilităţii

În conformitate cu Ghidurile proiectului Trust, vă rugăm să rețineți că informațiile furnizate pe această pagină nu sunt destinate și nu trebuie interpretate ca fiind consiliere juridică, fiscală, investițională, financiară sau orice altă formă de consiliere. Este important să investești doar ceea ce îți poți permite să pierzi și să cauți sfaturi financiare independente dacă ai îndoieli. Pentru informații suplimentare, vă sugerăm să consultați termenii și condițiile, precum și paginile de ajutor și asistență furnizate de emitent sau agent de publicitate. MetaversePost se angajează să raporteze corecte, imparțial, dar condițiile de piață pot fi modificate fără notificare.

Despre autor

Damir este liderul echipei, manager de produs și editor la Metaverse Post, care acoperă subiecte precum AI/ML, AGI, LLM-uri, Metaverse și Web3-domenii conexe. Articolele sale atrag o audiență masivă de peste un milion de utilizatori în fiecare lună. El pare a fi un expert cu 10 ani de experiență în SEO și marketing digital. Damir a fost menționat în Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto și alte publicații. Călătorește între Emiratele Arabe Unite, Turcia, Rusia și CSI ca nomad digital. Damir a obținut o diplomă de licență în fizică, despre care crede că i-a oferit abilitățile de gândire critică necesare pentru a avea succes în peisajul în continuă schimbare al internetului. 

Mai multe articole
Damir Yalalov
Damir Yalalov

Damir este liderul echipei, manager de produs și editor la Metaverse Post, care acoperă subiecte precum AI/ML, AGI, LLM-uri, Metaverse și Web3-domenii conexe. Articolele sale atrag o audiență masivă de peste un milion de utilizatori în fiecare lună. El pare a fi un expert cu 10 ani de experiență în SEO și marketing digital. Damir a fost menționat în Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto și alte publicații. Călătorește între Emiratele Arabe Unite, Turcia, Rusia și CSI ca nomad digital. Damir a obținut o diplomă de licență în fizică, despre care crede că i-a oferit abilitățile de gândire critică necesare pentru a avea succes în peisajul în continuă schimbare al internetului. 

Apetitul instituțional crește față de ETF-urile Bitcoin pe fondul volatilității

Dezvăluirile prin dosarele 13F dezvăluie investitori instituționali de seamă care se amestecă în ETF-uri Bitcoin, subliniind o acceptare tot mai mare a...

Aflați mai multe

Sosește ziua sentinței: soarta lui CZ este în echilibru, în timp ce tribunalul american ia în considerare pledoaria DOJ

Changpeng Zhao este pe cale de a fi condamnat astăzi într-un tribunal american din Seattle.

Aflați mai multe
Alăturați-vă comunității noastre tehnologice inovatoare
Citeste mai mult
Află mai multe
Injective își unește forțele cu AltLayer pentru a aduce securitatea refacerii în EVM
Afaceri Buletin de stiri Tehnologia
Injective își unește forțele cu AltLayer pentru a aduce securitatea refacerii în EVM
3 Mai, 2024
Masa face echipă cu Teller pentru a introduce grupul de împrumuturi MASA, care permite împrumuturile USDC pe bază
pieţe Buletin de stiri Tehnologia
Masa face echipă cu Teller pentru a introduce grupul de împrumuturi MASA, care permite împrumuturile USDC pe bază
3 Mai, 2024
Velodrome lansează versiunea Beta a Superchain în săptămânile următoare și se extinde în blockchainurile OP Stack Layer 2
pieţe Buletin de stiri Tehnologia
Velodrome lansează versiunea Beta a Superchain în săptămânile următoare și se extinde în blockchainurile OP Stack Layer 2
3 Mai, 2024
CARV anunță parteneriat cu Aethir pentru a-și descentraliza stratul de date și a distribui recompense
Afaceri Buletin de stiri Tehnologia
CARV anunță parteneriat cu Aethir pentru a-și descentraliza stratul de date și a distribui recompense
3 Mai, 2024
CRYPTOMERIA LABS PTE. LTD.