Laporan Berita Teknologi
Jun 22, 2023

Phi-1, Model Bahasa Padat, Outpaces GPT dalam Penjanaan Kod Cekap

Secara ringkas

Penyelidik membangunkan Phi-1, a model bahasa padat untuk penjanaan kod yang cekap, menggunakan 1.3 bilion parameter dan set data latihan yang lebih kecil.

Walaupun saiznya lebih kecil, ia mencapai hasil yang mengagumkan, dengan ketepatan lulus@1 sebanyak 50.6% pada HumanEval dan 55.5% pada penanda aras MBPP.

Phi-1, model padat namun berkuasa yang direka khusus untuk tugas penjanaan kod. Tidak seperti pendahulunya, Phi-1 menunjukkan prestasi unggul dalam pengekodan dan tugasan lain yang berkaitan sambil menggunakan parameter yang jauh lebih sedikit dan set data latihan yang lebih kecil.

Phi-1, Model Bahasa Padat, Outpaces GPT dalam Penjanaan Kod Cekap
Kredit: Midjourney / Yumtoast#2538
Lawatan: 12 Alat Pengekodan AI Terbaik 2023

Phi-1, model berasaskan Transformer, menonjol dengan hanya 1.3 bilion parameter, yang hanya sebahagian kecil daripada saiz model pesaing lain. Hebatnya, ia dilatih dalam masa empat hari sahaja menggunakan lapan A100. Proses latihan melibatkan data "kualiti buku teks" yang disusun dengan teliti yang diperoleh daripada web (6 bilion token) dan buku teks sintetik serta latihan yang dihasilkan dengan bantuan GPT-3.5 (1 bilion token).

Walaupun skalanya lebih kecil, Phi-1 mencapai keputusan yang mengagumkan, dengan ketepatan lulus@1 sebanyak 50.6% pada HumanEval dan 55.5% pada penanda aras MBPP. Lebih-lebih lagi, ia mempamerkan sifat-sifat kemunculan yang tidak dijangka jika dibandingkan dengan Phi-1-base, model terdahulu sebelum penalaan halus, dan Phi-1-small, model yang lebih kecil dengan 350 juta parameter. Walaupun dengan saiznya yang lebih kecil, Phi-1 masih mencapai ketepatan 45% yang dipuji pada HumanEval.

Kejayaan Phi-1 boleh dikaitkan dengan data berkualiti tinggi yang digunakan semasa latihan. Sama seperti buku teks yang komprehensif dan direka dengan baik membantu pelajar dalam menguasai mata pelajaran baharu, para penyelidik menumpukan pada mencipta data "kualiti buku teks" untuk meningkatkan kecekapan pembelajaran model bahasa. Pendekatan ini menghasilkan model yang mengatasi kebanyakan model sumber terbuka pada penanda aras pengekodan seperti HumanEval dan MBPP, walaupun saiz model dan volum set datanya lebih kecil.

Walau bagaimanapun, adalah penting untuk mengambil perhatian beberapa batasan Phi-1 berbanding model yang lebih besar. Pertama, Phi-1 pakar dalam pengekodan Python dan tidak mempunyai kepelbagaian model berbilang bahasa. Selain itu, ia tidak mempunyai pengetahuan khusus domain yang terdapat dalam model yang lebih besar, seperti pengaturcaraan dengan API tertentu atau menggunakan pakej yang kurang biasa. Akhir sekali, disebabkan sifat tersusun set data dan kekurangan kepelbagaian dalam bahasa dan gaya, Phi-1 kurang mantap kepada variasi gaya atau ralat dalam gesaan.

Para penyelidik mengakui batasan ini dan percaya bahawa kerja selanjutnya boleh menangani setiap daripada mereka. Mereka mencadangkan menggunakan GPT-4 untuk menjana data sintetik dan bukannya GPT-3.5, kerana mereka melihat kadar ralat yang tinggi dalam data yang terakhir. Walaupun terdapat ralat, Phi-1 menunjukkan kecekapan pengekodan yang luar biasa, sama seperti kajian terdahulu di mana model bahasa menghasilkan jawapan yang betul walaupun dilatih mengenai data dengan kadar ralat 100%.

Baca lebih lanjut mengenai AI:

Penafian

Selaras dengan Garis panduan Projek Amanah, sila ambil perhatian bahawa maklumat yang diberikan pada halaman ini tidak bertujuan untuk menjadi dan tidak seharusnya ditafsirkan sebagai nasihat undang-undang, cukai, pelaburan, kewangan atau sebarang bentuk nasihat lain. Adalah penting untuk hanya melabur apa yang anda mampu kehilangan dan mendapatkan nasihat kewangan bebas jika anda mempunyai sebarang keraguan. Untuk maklumat lanjut, kami mencadangkan merujuk kepada terma dan syarat serta halaman bantuan dan sokongan yang disediakan oleh pengeluar atau pengiklan. MetaversePost komited kepada laporan yang tepat dan tidak berat sebelah, tetapi keadaan pasaran tertakluk kepada perubahan tanpa notis.

Tentang Pengarang

Damir ialah ketua pasukan, pengurus produk dan editor di Metaverse Post, meliputi topik seperti AI/ML, AGI, LLM, Metaverse dan Web3-bidang berkaitan. Artikelnya menarik khalayak besar lebih sejuta pengguna setiap bulan. Dia nampaknya seorang pakar dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebut dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto dan penerbitan lain. Dia mengembara antara UAE, Turki, Rusia dan CIS sebagai nomad digital. Damir memperoleh ijazah sarjana muda dalam fizik, yang dia percaya telah memberikannya kemahiran berfikir kritis yang diperlukan untuk berjaya dalam landskap internet yang sentiasa berubah. 

lebih banyak artikel
Damir Yalalov
Damir Yalalov

Damir ialah ketua pasukan, pengurus produk dan editor di Metaverse Post, meliputi topik seperti AI/ML, AGI, LLM, Metaverse dan Web3-bidang berkaitan. Artikelnya menarik khalayak besar lebih sejuta pengguna setiap bulan. Dia nampaknya seorang pakar dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebut dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto dan penerbitan lain. Dia mengembara antara UAE, Turki, Rusia dan CIS sebagai nomad digital. Damir memperoleh ijazah sarjana muda dalam fizik, yang dia percaya telah memberikannya kemahiran berfikir kritis yang diperlukan untuk berjaya dalam landskap internet yang sentiasa berubah. 

Dari Ripple kepada The Big Green DAO: Bagaimana Projek Mata Wang Kripto Menyumbang kepada Amal

Mari kita terokai inisiatif yang memanfaatkan potensi mata wang digital untuk tujuan amal.

Mengetahui lebih lanjut

AlphaFold 3, Med-Gemini, dan lain-lain: The Way AI Transforms Healthcare in 2024

AI menjelma dalam pelbagai cara dalam penjagaan kesihatan, daripada mendedahkan korelasi genetik baharu kepada memperkasakan sistem pembedahan robotik ...

Mengetahui lebih lanjut
Sertai Komuniti Teknologi Inovatif Kami
Lebih Lanjut
Maklumat Lanjut
10 Alat AI Percuma Teratas untuk Penciptaan Kandungan, Penyuntingan Video dan Banyak Lagi
AI Wiki Digest Pendidikan Gaya hidup perisian Teknologi
10 Alat AI Percuma Teratas untuk Penciptaan Kandungan, Penyuntingan Video dan Banyak Lagi
Semoga 14, 2024
Suruhanjaya Sekuriti Hong Kong Memberi Amaran tentang Penipuan Deepfake yang Menyasarkan Industri Kripto: Implikasi untuk Keselamatan Pelabur
Gaya hidup Keselamatan Wiki perisian Cerita dan Ulasan Teknologi
Suruhanjaya Sekuriti Hong Kong Memberi Amaran tentang Penipuan Deepfake yang Menyasarkan Industri Kripto: Implikasi untuk Keselamatan Pelabur
Semoga 14, 2024
Ripple Dan Evmos Bekerjasama Membangunkan XRP Ledger EVM Sidechain Dengan Teknologi EvmOS
Perniagaan Laporan Berita Teknologi
Ripple Dan Evmos Bekerjasama Membangunkan XRP Ledger EVM Sidechain Dengan Teknologi EvmOS
Semoga 14, 2024
5ireChain Memulakan Insentif 'Testnet Thunder: GA' Untuk Ujian Tekanan Rangkaian, Menjemput Pengguna Untuk Menyertai Airdrop Ganjaran
Laporan Berita Teknologi
5ireChain Memulakan Insentif 'Testnet Thunder: GA' Untuk Ujian Tekanan Rangkaian, Menjemput Pengguna Untuk Menyertai Airdrop Ganjaran
Semoga 14, 2024