Pendapat Teknologi
Ogos 23, 2023

Penyelidik Mencabar Tanggapan 'Keupayaan Muncul' Model Bahasa Besar

Secara ringkas

Apocalypse AGI menjadi kebimbangan kerana fenomena model bahasa besar secara tiba-tiba menunjukkan kebolehan bahawa model yang lebih kecil nampaknya tidak ada.

Fenomena ini dipanggil "kebolehan baru muncul Model Bahasa Besar."

Pengarang artikel "Adakah Keupayaan Muncul Model Bahasa Besar Suatu Mirage?" berhujah bahawa kesan kebolehan yang baru muncul bukanlah fatamorgana, sebaliknya pertumbuhan yang boleh diramal dalam keupayaan untuk melaksanakan tugas.

Mereka menunjukkan bahawa sekurang-kurangnya 92% masalah Big Bench tidak mempunyai penemuan mendadak untuk model besar, dan kualiti model mereka berkembang dengan lancar dan boleh diramalkan apabila saiz model meningkat.

Dalam pemeriksaan baru-baru ini tentang keupayaan potensi model bahasa yang besar, penyelidik mencabar tanggapan "kebolehan yang muncul" dan memberi penerangan tentang aspek kefungsian yang lebih boleh diramalkan. Artikel bertajuk “Menyingkap Realiti Keupayaan Muncul Model Bahasa Besar” membawa perhatian kepada salah tafsiran metrik yang telah membawa kepada salah tanggapan bahawa model ini secara spontan memperoleh kemahiran lanjutan.

Penyelidik Mencabar Tanggapan 'Keupayaan Muncul' Model Bahasa Besar
Kredit: Metaverse Post / Stable Diffusion

Konsep "kebolehan yang muncul” dalam konteks model bahasa yang besar, seperti GPT siri, telah mencetuskan kebimbangan mengenai potensi model ini untuk membangunkan keupayaan yang tidak dijangka sama dengan kesedaran manusia. Makalah ini menegaskan bahawa andaian ini berdasarkan pemahaman yang salah tentang tingkah laku dan keupayaan sebenar model.

Fenomena yang biasa diperhatikan, di mana model yang lebih besar nampaknya memperoleh kebolehan baharu seperti penaakulan abstrak, penyelesaian masalah, dan juga jenaka, telah dicipta sebagai "kebolehan baru muncul Model Bahasa Besar." Pengarang artikel berpendapat bahawa kebolehan ini tidak sespontan yang kelihatan, sebaliknya hasil daripada metrik penilaian yang mengelirukan.

Untuk menggambarkan maksud mereka, penyelidik menganggap tugas "teka teka-teki itu," masalah di mana model bahasa diperlukan untuk memahami teka-teki bahasa semula jadi dan bertindak balas dengan jawapan yang betul dalam bahasa semula jadi. Secara tradisinya, kualiti respons telah dinilai menggunakan metrik binari: respons diberikan skor 1 jika ia betul-betul sepadan dengan jawapan yang betul dan skor 0 sebaliknya.

Inti dari perkara ini terletak pada kepekaan metrik terhadap kerumitan tugas dan bilangan parameter model. Para penyelidik mendedahkan bahawa metrik binari ini membawa kepada a persepsi menipu "kebolehan yang muncul." Model yang lebih kecil sering mempamerkan ketepatan yang boleh diabaikan (eps) pada metrik ini, manakala model yang lebih besar, terutamanya yang mempunyai kiraan parameter yang tinggi, nampaknya mencapai tahap ketepatan yang luar biasa (aks > 0.5).

Artikel itu menegaskan bahawa peralihan keupayaan yang jelas ini tidak menunjukkan model yang memperoleh kemahiran kompleks secara spontan. Sebaliknya, kapasiti model untuk memahami dan menjana respons yang lebih bernuansa berpunca daripada penilaian yang lebih teliti terhadap output mereka. Dengan memfokuskan pada padanan kebarangkalian dan koheren semantik dan bukannya padanan rentetan yang tepat, para penyelidik menunjukkan bahawa perkembangan model dalam prestasi mengikuti trajektori yang lebih logik, tanpa mengira saiznya.

Berkaitan: Evolusi Chatbots dari T9-Era dan GPT-1 kepada ChatGPT

Menyiasat Evolusi Prestasi Model dengan Menukar Parameter

Menyiasat Evolusi Prestasi Model dengan Menukar Parameter
Kredit: Metaverse Post / Stable Diffusion

Dalam penyiasatan analitikal, penyelidik mendedahkan mekanik halus di sebalik "kebolehan yang muncul" model bahasa yang besar. Kajian ini mempersoalkan pengaruh metrik superdiscrete dalam menilai prestasi model dan menjelaskan pemahaman yang lebih ramalan tentang keupayaan mereka apabila parameter model berkembang.

Tanggapan lazim tentang "kebolehan baru muncul" dalam model bahasa yang meluas telah memikat perbincangan dan menimbulkan kebimbangan tentang potensi kejayaan. Kajian ini bertujuan untuk merungkai mekanisme yang mendasari fenomena ini dan menguraikan sama ada model ini sememangnya mempamerkan keupayaan yang tiba-tiba, tidak pernah berlaku sebelum ini atau jika kemajuan yang dilihat ini boleh dikaitkan dengan sebab yang berbeza.

Di tengah-tengah kajian terletak penilaian teliti metrik yang digunakan untuk mengukur prestasi model. Para penyelidik berpendapat bahawa penggunaan metrik superdiscrete, terutamanya metrik binari konvensional yang menentukan padanan rentetan tepat, mungkin memesongkan tafsiran besar. kebolehan model bahasa. Kajian ini menganalisis dengan teliti bagaimana taburan kebarangkalian jawapan yang dijana model berkembang sebagai skala parameter model.

Bertentangan dengan tanggapan "kebolehan baru muncul," kajian itu mendedahkan trend yang lebih sistematik. Apabila saiz model meningkat, keupayaannya untuk menetapkan kebarangkalian yang lebih tinggi kepada jawapan yang sesuai dan kebarangkalian yang lebih rendah kepada yang salah bertambah baik. Ini mencerminkan peningkatan yang konsisten dalam kapasiti model untuk menyelesaikan masalah dengan cekap dalam pelbagai saiz. Pada dasarnya, kajian mencadangkan bahawa proses pembelajaran model mengikutidefitrajektori penambahbaikan dan bukannya lonjakan mendadak.

Penulis memperkenalkan anjakan paradigma dengan mencadangkan penggantian metrik diskret dengan yang berterusan. Perubahan ini menawarkan gambaran yang lebih jelas tentang evolusi prestasi. Melalui analisis mereka, para penyelidik memastikan bahawa kira-kira 92% daripada Masalah Bangku Besar mempamerkan pertumbuhan yang licin dan boleh diramal dalam kualiti apabila saiz model mengembang. Penemuan ini mencabar tanggapan bahawa model yang lebih besar mengalami penemuan mendadak dan sebaliknya menyerlahkan perkembangan yang lebih beransur-ansur dan dijangkakan.

Kajian itu meluaskan pandangannya untuk mengesahkan tuntutannya. Ia menunjukkan bahawa kesan "keupayaan muncul" yang sama boleh disimulasikan secara buatan menggunakan pengekod automatik konvensional, menunjukkan bahawa pilihan metrik mempengaruhi hasil yang dilihat dengan ketara. Pendedahan ini meluaskan skop implikasi kajian, menunjukkan perkaitannya melangkaui model bahasa sahaja.

Para penyelidik menekankan bahawa keputusan mereka tidak defisecara nitif menafikan potensi "kebolehan yang muncul" atau kesedaran dalam model bahasa yang besar. Walau bagaimanapun, penemuan mereka menggalakkan penyelidik untuk mendekati tuntutan tersebut dengan perspektif yang bernuansa. Daripada tergesa-gesa mengekstrapolasi dan membuat kesimpulan yang melampau, kajian itu menekankan kepentingan penyiasatan yang teliti dan analisis komprehensif.

Baca lebih lanjut mengenai AI:

Penafian

Selaras dengan Garis panduan Projek Amanah, sila ambil perhatian bahawa maklumat yang diberikan pada halaman ini tidak bertujuan untuk menjadi dan tidak seharusnya ditafsirkan sebagai nasihat undang-undang, cukai, pelaburan, kewangan atau sebarang bentuk nasihat lain. Adalah penting untuk hanya melabur apa yang anda mampu kehilangan dan mendapatkan nasihat kewangan bebas jika anda mempunyai sebarang keraguan. Untuk maklumat lanjut, kami mencadangkan merujuk kepada terma dan syarat serta halaman bantuan dan sokongan yang disediakan oleh pengeluar atau pengiklan. MetaversePost komited kepada laporan yang tepat dan tidak berat sebelah, tetapi keadaan pasaran tertakluk kepada perubahan tanpa notis.

Tentang Pengarang

Damir ialah ketua pasukan, pengurus produk dan editor di Metaverse Post, meliputi topik seperti AI/ML, AGI, LLM, Metaverse dan Web3-bidang berkaitan. Artikelnya menarik khalayak besar lebih sejuta pengguna setiap bulan. Dia nampaknya seorang pakar dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebut dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto dan penerbitan lain. Dia mengembara antara UAE, Turki, Rusia dan CIS sebagai nomad digital. Damir memperoleh ijazah sarjana muda dalam fizik, yang dia percaya telah memberikannya kemahiran berfikir kritis yang diperlukan untuk berjaya dalam landskap internet yang sentiasa berubah. 

lebih banyak artikel
Damir Yalalov
Damir Yalalov

Damir ialah ketua pasukan, pengurus produk dan editor di Metaverse Post, meliputi topik seperti AI/ML, AGI, LLM, Metaverse dan Web3-bidang berkaitan. Artikelnya menarik khalayak besar lebih sejuta pengguna setiap bulan. Dia nampaknya seorang pakar dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebut dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto dan penerbitan lain. Dia mengembara antara UAE, Turki, Rusia dan CIS sebagai nomad digital. Damir memperoleh ijazah sarjana muda dalam fizik, yang dia percaya telah memberikannya kemahiran berfikir kritis yang diperlukan untuk berjaya dalam landskap internet yang sentiasa berubah. 

Selera Institusi Berkembang Terhadap Bitcoin ETF Di Tengah-tengah Kemeruapan

Pendedahan melalui pemfailan 13F mendedahkan pelabur institusi terkenal yang berkecimpung dalam Bitcoin ETF, menekankan penerimaan yang semakin meningkat terhadap ...

Mengetahui lebih lanjut

Hari Penghukuman Tiba: Nasib CZ Bergantung Seimbang apabila Mahkamah AS Mempertimbangkan Rayuan DOJ

Changpeng Zhao bersedia untuk menghadapi hukuman di mahkamah AS di Seattle hari ini.

Mengetahui lebih lanjut
Sertai Komuniti Teknologi Inovatif Kami
Lebih Lanjut
Maklumat Lanjut
Inside Wall Street Memes (WSM): Membongkar Tajuk Berita
Perniagaan pasaran Cerita dan Ulasan Teknologi
Inside Wall Street Memes (WSM): Membongkar Tajuk Berita
Semoga 7, 2024
Temui Paus Kripto: Siapa Siapa di Pasaran
Perniagaan pasaran Cerita dan Ulasan Teknologi
Temui Paus Kripto: Siapa Siapa di Pasaran
Semoga 7, 2024
Orbiter Finance Bekerjasama Dengan Bitcoin Layer 2 Zulu Network Dan Digunakan Pada Is Lwazi Testnet
Perniagaan Laporan Berita Teknologi
Orbiter Finance Bekerjasama Dengan Bitcoin Layer 2 Zulu Network Dan Digunakan Pada Is Lwazi Testnet 
Semoga 7, 2024
Crypto Exchange Bybit Mengintegrasikan Ethena Labs' USDe Sebagai Aset Cagaran, Membolehkan Pasangan Dagangan BTC-USDe dan ETH-USDe
pasaran Laporan Berita Teknologi
Crypto Exchange Bybit Mengintegrasikan Ethena Labs' USDe Sebagai Aset Cagaran, Membolehkan Pasangan Dagangan BTC-USDe dan ETH-USDe
Semoga 7, 2024