Laporan berita Teknologi
Juni 05, 2023

LLaMa dengan 7 Miliar Parameter Mencapai Inferensi Secepat Kilat pada Chip Apple M2 Max

Singkatnya

LLaMa model berjalan dengan kecepatan 40 token per detik pada chip M2 Max, menunjukkan pemanfaatan CPU 0%, memicu imajinasi para penggemar dan pengguna AI.

Model AI dapat disesuaikan dengan kebutuhan individu dan dijalankan secara lokal di perangkat pribadi, memberikan bantuan yang dipersonalisasi dan menyederhanakan tugas rutin.

Prestasi inovatif di bidang AI telah diresmikan sebagai LLaMa model dengan 7 miliar parameter yang menakjubkan sekarang berjalan dengan kecepatan 40 token per detik yang mengesankan di MacBook yang dilengkapi dengan chip M2 Max mutakhir. Prestasi luar biasa ini dimungkinkan melalui pembaruan terbaru ke repositori GIT oleh Greganov, yang berhasil mengimplementasikan inferensi model pada GPU logam, akselerator khusus yang ditemukan di chip terbaru Apple.

LLaMa dengan 7 Miliar Parameter Mencapai Inferensi Secepat Kilat pada Chip Apple M2 Max
kredit: Metaverse Post (mpost.io)
Direkomendasikan: Guanaco Muncul sebagai Sumber Terbuka yang Potensial ChatGPT Saingan

Penerapan inferensi model pada GPU Metal membuahkan hasil yang luar biasa. Memanfaatkan perangkat keras khusus ini, LLaMa model menunjukkan penggunaan CPU 0% yang luar biasa, secara efektif memanfaatkan kekuatan pemrosesan dari 38 inti Logam. Pencapaian ini tidak hanya menunjukkan kemampuan model namun juga menyoroti keterampilan dan keahlian luar biasa Greganov sebagai insinyur yang luar biasa.

Implikasi dari perkembangan ini sangat luas, memicu imajinasi para penggemar dan pengguna AI. Dengan dipersonalisasi LLaMa Dengan model yang dijalankan secara lokal, tugas-tugas rutin dapat dengan mudah dikelola oleh individu, sehingga mengantarkan era baru modularisasi. Konsep tersebut berkisar pada a model besar dilatih secara terpusat, yang kemudian disempurnakan dan disesuaikan oleh setiap pengguna pada data pribadi mereka, menghasilkan asisten AI yang sangat personal dan efisien.

Visi memiliki personalisasi LLaMa model yang membantu individu dalam urusan sehari-hari memiliki potensi yang sangat besar. Dengan melokalkan model pada perangkat pribadi, pengguna dapat merasakan manfaat AI yang kuat sekaligus mempertahankan kontrol atas data mereka. Pelokalan ini juga memastikan waktu respons yang cepat, memungkinkan interaksi yang cepat dan lancar dengan asisten AI.

Kombinasi ukuran model yang masif dan inferensi yang efisien pada perangkat keras khusus membuka jalan bagi masa depan di mana AI menjadi bagian integral dari kehidupan manusia, memberikan bantuan yang dipersonalisasi dan menyederhanakan tugas-tugas rutin.

Kemajuan seperti ini membawa kita semakin dekat untuk mewujudkan dunia di mana model AI dapat disesuaikan dengan kebutuhan individu dan dijalankan secara lokal di perangkat pribadi. Dengan setiap pengguna memiliki kemampuan untuk menyempurnakan dan mengoptimalkannya LLaMa berdasarkan data unik mereka, potensi efisiensi dan produktivitas yang didorong oleh AI tidak terbatas.

Prestasi yang diraih terlihat di LLaMa Performa model pada chip Apple M2 Max menjadi bukti kemajuan pesat sedang dibuat dalam penelitian dan pengembangan AI. Dengan insinyur yang berdedikasi seperti Greganov mendorong batas-batas dari apa yang mungkin, masa depan menjanjikan untuk personalisasi, efisien, dan dijalankan secara lokal Model AI yang akan mengubah cara kita berinteraksi dengan teknologi.

Baca lebih lanjut tentang AI:

Penolakan tanggung jawab

Sejalan dengan Percayai pedoman Proyek, harap dicatat bahwa informasi yang diberikan pada halaman ini tidak dimaksudkan untuk dan tidak boleh ditafsirkan sebagai nasihat hukum, pajak, investasi, keuangan, atau bentuk nasihat lainnya. Penting untuk hanya menginvestasikan jumlah yang mampu Anda tanggung kerugiannya dan mencari nasihat keuangan independen jika Anda ragu. Untuk informasi lebih lanjut, kami menyarankan untuk merujuk pada syarat dan ketentuan serta halaman bantuan dan dukungan yang disediakan oleh penerbit atau pengiklan. MetaversePost berkomitmen terhadap pelaporan yang akurat dan tidak memihak, namun kondisi pasar dapat berubah tanpa pemberitahuan.

Tentang Penulis

Damir adalah pemimpin tim, manajer produk, dan editor di Metaverse Post, mencakup topik seperti AI/ML, AGI, LLM, Metaverse, dan Web3-bidang terkait. Artikelnya menarik lebih dari satu juta pengguna setiap bulan. Dia tampaknya ahli dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebutkan dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, dan publikasi lainnya. Dia melakukan perjalanan antara UEA, Turki, Rusia, dan CIS sebagai pengembara digital. Damir memperoleh gelar sarjana dalam bidang fisika, yang menurutnya telah memberinya keterampilan berpikir kritis yang diperlukan untuk berhasil dalam lanskap internet yang selalu berubah. 

lebih artikel
Damir Yalalov
Damir Yalalov

Damir adalah pemimpin tim, manajer produk, dan editor di Metaverse Post, mencakup topik seperti AI/ML, AGI, LLM, Metaverse, dan Web3-bidang terkait. Artikelnya menarik lebih dari satu juta pengguna setiap bulan. Dia tampaknya ahli dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebutkan dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, dan publikasi lainnya. Dia melakukan perjalanan antara UEA, Turki, Rusia, dan CIS sebagai pengembara digital. Damir memperoleh gelar sarjana dalam bidang fisika, yang menurutnya telah memberinya keterampilan berpikir kritis yang diperlukan untuk berhasil dalam lanskap internet yang selalu berubah. 

Selera Institusional Tumbuh Terhadap ETF Bitcoin Di Tengah Volatilitas

Pengungkapan melalui pengajuan 13F mengungkapkan investor institusi terkemuka yang mencoba-coba ETF Bitcoin, menggarisbawahi semakin besarnya penerimaan ...

Tahu lebih banyak

Hari Hukuman Tiba: Nasib CZ Digantung Saat Pengadilan AS Mempertimbangkan Permohonan DOJ

Changpeng Zhao siap menghadapi hukuman di pengadilan AS di Seattle hari ini.

Tahu lebih banyak
Bergabunglah dengan Komunitas Teknologi Inovatif Kami
Baca Selengkapnya
Baca lebih lanjut
Morph Memperkenalkan Holesky Testnet Dengan Integrasi zkEVM yang Optimis, Mekanisme Jembatan, dan Fitur Jaringan Sequencer Terdesentralisasi
Laporan berita Teknologi
Morph Memperkenalkan Holesky Testnet Dengan Integrasi zkEVM yang Optimis, Mekanisme Jembatan, dan Fitur Jaringan Sequencer Terdesentralisasi
6 Mei 2024
Robinhood Crypto Menerima Pemberitahuan Wells Dari Komisi Sekuritas dan Bursa Atas Dugaan Pelanggaran Sekuritas
pasar Laporan berita Teknologi
Robinhood Crypto Menerima Pemberitahuan Wells Dari Komisi Sekuritas dan Bursa Atas Dugaan Pelanggaran Sekuritas
6 Mei 2024
QuickSwap Disebarkan Pada Mainnet Lapisan X Dan Memperluas Jaringan CDK Polygon Dengan Peluncuran Citadel
Laporan berita Teknologi
QuickSwap Disebarkan Pada Mainnet Lapisan X Dan Memperluas Jaringan CDK Polygon Dengan Peluncuran Citadel 
6 Mei 2024
Layer 2 Network Linea Memulai Klaim Token ZERO ZeroLend Airdrop Pengguna Dan Investor
pasar Laporan berita Teknologi
Layer 2 Network Linea Memulai Klaim Token ZERO ZeroLend Airdrop Pengguna Dan Investor
6 Mei 2024