Laporan Berita Teknologi
Februari 24, 2023

Keluaran Meta LLaMA: Model Bahasa Asas Terkini untuk Penyelidikan AI

Secara ringkas

Meta telah mengumumkan keluaran model bahasa besar baharu yang dipanggil LLaMA, direka untuk membantu penyelidik AI memajukan kerja mereka dalam bidang AI.

LLaMA tersedia dalam beberapa saiz, antara parameter 7B hingga 65B, dan direka bentuk untuk serba boleh.

meta llama

Meta telah dikeluarkan model bahasa besar baharu yang dipanggil LLaMA (Large Language Model Meta AI) untuk menyokong penyelidik AI. Model ini akan membolehkan lebih ramai orang dalam komuniti penyelidikan untuk belajar model bahasa dan menyediakan akses yang lebih mudah kepada bidang penting ini.

LLaMA tersedia dalam beberapa saiz (parameter 7B, 13B, 33B dan 65B). Dengan melatih model asas yang lebih kecil seperti LLaMA, penyelidik boleh menggunakan kurang kuasa dan sumber pengkomputeran untuk menguji pendekatan baharu dan meneroka kes penggunaan baharu. Meta menulis itu LLaMA sesuai untuk memperhalusi pelbagai tugas kerana ia melatih pada set besar data tidak berlabel. Meta mendakwa komited terhadap amalan dan perkongsian AI yang bertanggungjawab a LLAMA model kad yang memperincikan bagaimana model itu dibina.

Untuk membina LLaMA, Meta memilih teks daripada 20 bahasa yang paling banyak digunakan, memfokuskan pada bahasa yang menggunakan abjad Latin dan Cyrillic. Model bahasa besar ini menjana teks dengan mengambil urutan perkataan sebagai input dan meramalkan perkataan seterusnya secara rekursif, serupa dengan model lain dalam kategori ini.

“Sebagai model asas, LLaMA direka bentuk untuk serba boleh dan boleh digunakan pada banyak kes penggunaan yang berbeza, berbanding model diperhalusi yang direka untuk tugas tertentu. Dengan berkongsi kod untuk LLaMA, lain-lain penyelidik lebih mudah menguji pendekatan baharu untuk mengehadkan atau menghapuskan masalah ini dalam model bahasa yang besar,”

Meta menulis.

Syarikat itu mengakui ia masih perlu menangani risiko berat sebelah, komen toksik, dan halusinasi secara besar-besaran model bahasa, Termasuk LLaMA.

Meta mengeluarkan model di bawah lesen bukan komersial yang memfokuskan pada kes penggunaan penyelidikan "untuk mengekalkan integriti dan mencegah penyalahgunaan." Individu dan organisasi yang mencari akses kepada model akan dinilai berdasarkan kes demi kes. Pihak yang layak termasuk penyelidik akademik, organisasi kerajaan dan masyarakat sivil, dan makmal penyelidikan industri di seluruh dunia.

Anda boleh membaca keseluruhan kertas LLaMA disini. Kalau layak pun boleh memohon untuk menguji model bahasa.

Baca lebih lanjut:

Tags:

Penafian

Selaras dengan Garis panduan Projek Amanah, sila ambil perhatian bahawa maklumat yang diberikan pada halaman ini tidak bertujuan untuk menjadi dan tidak seharusnya ditafsirkan sebagai nasihat undang-undang, cukai, pelaburan, kewangan atau sebarang bentuk nasihat lain. Adalah penting untuk hanya melabur apa yang anda mampu kehilangan dan mendapatkan nasihat kewangan bebas jika anda mempunyai sebarang keraguan. Untuk maklumat lanjut, kami mencadangkan merujuk kepada terma dan syarat serta halaman bantuan dan sokongan yang disediakan oleh pengeluar atau pengiklan. MetaversePost komited kepada laporan yang tepat dan tidak berat sebelah, tetapi keadaan pasaran tertakluk kepada perubahan tanpa notis.

Tentang Pengarang

Agne ialah seorang wartawan yang membuat liputan tentang trend dan perkembangan terkini dalam metaverse, AI, dan Web3 industri untuk Metaverse Post. Keghairahannya untuk bercerita telah menyebabkan dia menjalankan banyak temu bual dengan pakar dalam bidang ini, sentiasa berusaha untuk mendedahkan cerita yang menarik dan menarik. Agne memegang ijazah Sarjana Muda dalam kesusasteraan dan mempunyai latar belakang yang luas dalam penulisan tentang pelbagai topik termasuk perjalanan, seni dan budaya. Dia juga menawarkan diri sebagai editor untuk organisasi hak haiwan, di mana dia membantu meningkatkan kesedaran tentang isu kebajikan haiwan. Hubungi dia [e-mel dilindungi].

lebih banyak artikel
Agne Cimerman
Agne Cimerman

Agne ialah seorang wartawan yang membuat liputan tentang trend dan perkembangan terkini dalam metaverse, AI, dan Web3 industri untuk Metaverse Post. Keghairahannya untuk bercerita telah menyebabkan dia menjalankan banyak temu bual dengan pakar dalam bidang ini, sentiasa berusaha untuk mendedahkan cerita yang menarik dan menarik. Agne memegang ijazah Sarjana Muda dalam kesusasteraan dan mempunyai latar belakang yang luas dalam penulisan tentang pelbagai topik termasuk perjalanan, seni dan budaya. Dia juga menawarkan diri sebagai editor untuk organisasi hak haiwan, di mana dia membantu meningkatkan kesedaran tentang isu kebajikan haiwan. Hubungi dia [e-mel dilindungi].

Hot Stories
Sertai Surat Berita Kami.
Berita Terkini

Kegilaan DOGE: Menganalisis Lonjakan Nilai Terkini Dogecoin (DOGE).

Industri mata wang kripto berkembang pesat, dan syiling meme sedang bersedia untuk peningkatan yang ketara. Dogecoin (DOGE), ...

Mengetahui lebih lanjut

Evolusi Kandungan Dijana AI dalam Metaverse

Kemunculan kandungan AI generatif adalah salah satu perkembangan yang paling menarik dalam persekitaran maya ...

Mengetahui lebih lanjut
Sertai Komuniti Teknologi Inovatif Kami
Untuk Lebih Lanjut
Baca lagi
Tawaran Teratas Minggu Ini, Pelaburan Utama dalam AI, IT, Web3, dan Kripto (22-26.04)
Digest Perniagaan pasaran Teknologi
Tawaran Teratas Minggu Ini, Pelaburan Utama dalam AI, IT, Web3, dan Kripto (22-26.04)
April 26, 2024
Vitalik Buterin Mengulas Mengenai Pemusatan PoW, Perhatikan Ia Adalah Peringkat Sementara Sehingga PoS
Laporan Berita Teknologi
Vitalik Buterin Mengulas Mengenai Pemusatan PoW, Perhatikan Ia Adalah Peringkat Sementara Sehingga PoS
April 26, 2024
Offchain Labs Mendedahkan Penemuan Dua Kerentanan Kritikal Dalam Bukti Penipuan OP Stack Optimism
Laporan Berita perisian Teknologi
Offchain Labs Mendedahkan Penemuan Dua Kerentanan Kritikal Dalam Bukti Penipuan OP Stack Optimism
April 26, 2024
Pasaran Terbuka Dymension Untuk Merapatkan Kecairan Daripada RollApps eIBC Dilancarkan Di Mainnet
Laporan Berita Teknologi
Pasaran Terbuka Dymension Untuk Merapatkan Kecairan Daripada RollApps eIBC Dilancarkan Di Mainnet 
April 26, 2024