Laporan Berita Teknologi
Jun 05, 2023

LLaMa dengan 7 Bilion Parameter Mencapai Inferens Sepantas Kilat pada Cip Apple M2 Max

Secara ringkas

LLaMa model berjalan pada 40 token sesaat pada cip M2 Max, menunjukkan penggunaan CPU 0%, mencetuskan imaginasi peminat dan pengguna AI.

Model AI boleh disesuaikan dengan keperluan individu dan dijalankan secara tempatan pada peranti peribadi, memberikan bantuan yang diperibadikan dan memperkemas tugas rutin.

Pencapaian terobosan dalam bidang AI telah diumumkan sebagai LLaMa model dengan 7 bilion parameter yang menakjubkan kini berjalan pada kelajuan mengagumkan 40 token sesaat pada MacBook yang dilengkapi dengan cip M2 Max yang canggih. Pencapaian yang luar biasa ini diwujudkan melalui kemas kini terbaru kepada repositori GIT oleh Greganov, yang berjaya melaksanakan inferens model pada GPU logam, pemecut khusus yang terdapat dalam cip terbaru Apple.

LLaMa dengan 7 Bilion Parameter Mencapai Inferens Sepantas Kilat pada Cip Apple M2 Max
Kredit: Metaverse Post (mpost.io)
Disyorkan: Guanaco Muncul sebagai Sumber Terbuka Berpotensi ChatGPT Pesaing

Pelaksanaan inferens model pada GPU Logam telah membuahkan hasil yang luar biasa. Menggunakan perkakasan khas ini, yang LLaMa model menunjukkan penggunaan CPU 0% yang mengagumkan, dengan berkesan memanfaatkan kuasa pemprosesan kesemua 38 teras Logam. Pencapaian ini bukan sahaja mempamerkan keupayaan model tetapi juga menyerlahkan kemahiran dan kepakaran luar biasa Greganov sebagai seorang jurutera yang luar biasa.

Implikasi daripada perkembangan ini adalah meluas, mencetuskan imaginasi peminat dan pengguna AI. Dengan diperibadikan LLaMa model yang dijalankan secara tempatan, tugas rutin boleh diuruskan dengan mudah oleh individu, menyambut era baharu modularisasi. Konsepnya berkisar tentang a model besar-besaran terlatih secara berpusat, yang kemudiannya diperhalusi dan disesuaikan oleh setiap pengguna pada data peribadi mereka, menghasilkan pembantu AI yang sangat diperibadikan dan cekap.

Visi mempunyai peribadi LLaMa model membantu individu dengan perkara harian mempunyai potensi yang besar. Dengan menyetempatkan model pada peranti peribadi, pengguna boleh mengalami manfaat AI yang berkuasa sambil mengekalkan kawalan ke atas data mereka. Penyetempatan ini juga memastikan masa tindak balas yang pantas, membolehkan interaksi pantas dan lancar dengan pembantu AI.

Gabungan saiz model yang besar dan inferens yang cekap pada perkakasan khusus membuka jalan untuk masa depan di mana AI menjadi sebahagian penting dalam kehidupan orang ramai, memberikan bantuan yang diperibadikan dan memperkemas tugas rutin.

Kemajuan seperti ini membawa kita lebih dekat untuk merealisasikan dunia di mana model AI boleh disesuaikan dengan keperluan individu dan dijalankan secara tempatan pada peranti peribadi. Dengan setiap pengguna mempunyai keupayaan untuk memperhalusi dan mengoptimumkan mereka LLaMa berdasarkan data unik mereka, potensi kecekapan dan produktiviti dipacu AI adalah tidak terhad.

Pencapaian yang disaksikan dalam LLaMa prestasi model pada cip Apple M2 Max berfungsi sebagai bukti kepada kemajuan pesat dibuat dalam penyelidikan dan pembangunan AI. Dengan jurutera yang berdedikasi seperti Greganov menolak sempadan apa yang mungkin, masa depan menjanjikan untuk diperibadikan, cekap dan dikendalikan secara tempatan Model AI yang akan mengubah cara kita berinteraksi dengan teknologi.

Baca lebih lanjut mengenai AI:

Penafian

Selaras dengan Garis panduan Projek Amanah, sila ambil perhatian bahawa maklumat yang diberikan pada halaman ini tidak bertujuan untuk menjadi dan tidak seharusnya ditafsirkan sebagai nasihat undang-undang, cukai, pelaburan, kewangan atau sebarang bentuk nasihat lain. Adalah penting untuk hanya melabur apa yang anda mampu kehilangan dan mendapatkan nasihat kewangan bebas jika anda mempunyai sebarang keraguan. Untuk maklumat lanjut, kami mencadangkan merujuk kepada terma dan syarat serta halaman bantuan dan sokongan yang disediakan oleh pengeluar atau pengiklan. MetaversePost komited kepada laporan yang tepat dan tidak berat sebelah, tetapi keadaan pasaran tertakluk kepada perubahan tanpa notis.

Tentang Pengarang

Damir ialah ketua pasukan, pengurus produk dan editor di Metaverse Post, meliputi topik seperti AI/ML, AGI, LLM, Metaverse dan Web3-bidang berkaitan. Artikelnya menarik khalayak besar lebih sejuta pengguna setiap bulan. Dia nampaknya seorang pakar dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebut dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto dan penerbitan lain. Dia mengembara antara UAE, Turki, Rusia dan CIS sebagai nomad digital. Damir memperoleh ijazah sarjana muda dalam fizik, yang dia percaya telah memberikannya kemahiran berfikir kritis yang diperlukan untuk berjaya dalam landskap internet yang sentiasa berubah. 

lebih banyak artikel
Damir Yalalov
Damir Yalalov

Damir ialah ketua pasukan, pengurus produk dan editor di Metaverse Post, meliputi topik seperti AI/ML, AGI, LLM, Metaverse dan Web3-bidang berkaitan. Artikelnya menarik khalayak besar lebih sejuta pengguna setiap bulan. Dia nampaknya seorang pakar dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebut dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto dan penerbitan lain. Dia mengembara antara UAE, Turki, Rusia dan CIS sebagai nomad digital. Damir memperoleh ijazah sarjana muda dalam fizik, yang dia percaya telah memberikannya kemahiran berfikir kritis yang diperlukan untuk berjaya dalam landskap internet yang sentiasa berubah. 

Selera Institusi Berkembang Terhadap Bitcoin ETF Di Tengah-tengah Kemeruapan

Pendedahan melalui pemfailan 13F mendedahkan pelabur institusi terkenal yang berkecimpung dalam Bitcoin ETF, menekankan penerimaan yang semakin meningkat terhadap ...

Mengetahui lebih lanjut

Hari Penghukuman Tiba: Nasib CZ Bergantung Seimbang apabila Mahkamah AS Mempertimbangkan Rayuan DOJ

Changpeng Zhao bersedia untuk menghadapi hukuman di mahkamah AS di Seattle hari ini.

Mengetahui lebih lanjut
Sertai Komuniti Teknologi Inovatif Kami
Untuk Lebih Lanjut
Baca lagi
Injektif Menyertai Pasukan Dengan AltLayer Untuk Membawa Keselamatan Restaking Kepada inEVM
Perniagaan Laporan Berita Teknologi
Injektif Menyertai Pasukan Dengan AltLayer Untuk Membawa Keselamatan Restaking Kepada inEVM
Semoga 3, 2024
Masa Bekerjasama Dengan Juruwang Untuk Memperkenalkan Kumpulan Pinjaman MASA, Membolehkan Pinjaman USDC Di Pangkalan
pasaran Laporan Berita Teknologi
Masa Bekerjasama Dengan Juruwang Untuk Memperkenalkan Kumpulan Pinjaman MASA, Membolehkan Pinjaman USDC Di Pangkalan
Semoga 3, 2024
Velodrome Melancarkan Versi Beta Superchain Dalam Minggu Akan Datang Dan Berkembang Merentasi OP Stack Layer 2 Blockchains
pasaran Laporan Berita Teknologi
Velodrome Melancarkan Versi Beta Superchain Dalam Minggu Akan Datang Dan Berkembang Merentasi OP Stack Layer 2 Blockchains
Semoga 3, 2024
CARV Mengumumkan Perkongsian Dengan Aethir Untuk Memusnahkan Lapisan Datanya Dan Mengedarkan Ganjaran
Perniagaan Laporan Berita Teknologi
CARV Mengumumkan Perkongsian Dengan Aethir Untuk Memusnahkan Lapisan Datanya Dan Mengedarkan Ganjaran
Semoga 3, 2024