Laporan Berita Teknologi
Semoga 31, 2023

Guanaco Muncul sebagai Sumber Terbuka Berpotensi ChatGPT Pesaing

Secara ringkas

Guanaco, chatbot sumber terbuka yang dibangunkan oleh penyelidik Universiti Washington, bercita-cita untuk bersaing dengannya ChatGPT sambil memerlukan sedikit masa dan wang untuk latihan.

Satu kajian baru, bagaimanapun, telah mempersoalkan keberkesanan model seperti Alpaca.

Penyelidik dari Universiti Washington telah mendedahkan guanaco, bot sembang sumber terbuka yang bertujuan untuk menandingi prestasi ChatGPT sambil mengurangkan dengan ketara masa dan sumber yang diperlukan untuk latihan. Dinamakan sempena saudara Amerika Selatan llamas, Guanaco dibina di atas LLaMA model bahasa dan menggabungkan kaedah penalaan halus baru yang dipanggil QLoRA.

Guanaco Muncul sebagai Sumber Terbuka Berpotensi ChatGPT Pesaing
Metaverse Post (mpost.io)

Pencipta Guanaco mendakwa bahawa ia mencapai prestasi yang setanding dengan ChatGPT tetapi boleh dilatih dalam sehari sahaja. Pencapaian yang luar biasa ini dimungkinkan oleh QLoRA, teknik penalaan halus model bahasa yang mengurangkan jumlah memori GPU yang diperlukan untuk latihan dengan ketara. manakala ChatGPT memerlukan memori GPU sebanyak 780 GB untuk model dengan 65 bilion parameter, versi termudah Guanaco hanya memerlukan 5 GB.

Dengan peningkatan kecekapan yang mengagumkan ini, Guanaco dan model sumber terbuka yang serupa mencabar tanggapan bahawa latihan yang mahal diperlukan untuk model bahasa terkini. Kemunculan Guanaco, Alpaca, dan model lain kereta api itu pada sebahagian kecil daripada kos telah membawa kepada spekulasi tentang masa depan model mahal seperti GPT.

Walau bagaimanapun, tidak semua orang bersetuju dengan pandangan optimis model sumber terbuka ini. Kajian terbaru yang dijalankan oleh Universiti California telah menimbulkan keraguan tentang keupayaan model seperti alpacas dan menimbulkan persoalan tentang potensi sebenar mereka. Pada mulanya, penyelidik mencapai kesimpulan yang sama kepada pencipta Guanaco: apabila dilatih dengan betul, model sumber terbuka boleh menandingi GPT dalam keupayaan. Ujian lanjut menunjukkan had yang ketara. Model "Dolly" ini, seperti yang kadang-kadang dipanggil, mahir meniru penyelesaian kepada masalah yang mereka hadapi semasa latihan. Walau bagaimanapun, mereka bergelut untuk melaksanakan tugas dengan baik pada tugas yang mereka belum didedahkan secara jelas, ketinggalan di belakang model yang lebih maju.

Pendedahan ini mencadangkan bahawa berjuta-juta dilaburkan dalam latihan GPT dan model serupa mungkin tidak sia-sia. Walaupun Guanaco dan rakan sejawatannya menunjukkan hasil yang memberangsangkan, masih terdapat kawasan di mana model yang lebih canggih unggul. Perlu diingat bahawa penyelidikan yang dijalankan oleh Universiti California mencabar tanggapan lazim bahawa model sumber terbuka boleh menggantikan sepenuhnya model mahal seperti GPT.

Memandangkan bidang pemprosesan bahasa semula jadi berkembang, adalah menarik untuk melihat bagaimana Guanaco dan model sumber terbuka lain adil terhadap yang mantap. penanda aras seperti ChatGPT. Kadar inovasi yang tinggi dan penyelidikan berterusan, tanpa persoalan, akan memberi kesan kepada masa depan model bahasa dan menentukan model mana yang menjadi pilihan utama untuk aplikasi tertentu.

  • Dolly 2.0, sumber terbuka 12B Chat-LLM pertama yang tersedia secara komersial, telah diumumkan oleh Databricks. Ini merupakan kemajuan yang ketara untuk industri pembelajaran mesin, yang membolehkan perniagaan mencipta model bahasa yang berkesan tanpa melabur dalam kelompok GPU yang mahal. Databricks melibatkan 5,000 pekerja untuk mencipta model bahasa sumber terbuka mereka, yang termasuk model bahasa Pythia-12B EleutherAI di bawah lesen MIT. Dolly 2.0, serta kod yang berkaitan, tersedia di bawah lesen MIT. Dolly 2.0 mempunyai potensi untuk mengubah industri dan merupakan langkah ke hadapan yang penting untuk pembelajaran mesin.

Baca lebih lanjut mengenai AI:

Penafian

Selaras dengan Garis panduan Projek Amanah, sila ambil perhatian bahawa maklumat yang diberikan pada halaman ini tidak bertujuan untuk menjadi dan tidak seharusnya ditafsirkan sebagai nasihat undang-undang, cukai, pelaburan, kewangan atau sebarang bentuk nasihat lain. Adalah penting untuk hanya melabur apa yang anda mampu kehilangan dan mendapatkan nasihat kewangan bebas jika anda mempunyai sebarang keraguan. Untuk maklumat lanjut, kami mencadangkan merujuk kepada terma dan syarat serta halaman bantuan dan sokongan yang disediakan oleh pengeluar atau pengiklan. MetaversePost komited kepada laporan yang tepat dan tidak berat sebelah, tetapi keadaan pasaran tertakluk kepada perubahan tanpa notis.

Tentang Pengarang

Damir ialah ketua pasukan, pengurus produk dan editor di Metaverse Post, meliputi topik seperti AI/ML, AGI, LLM, Metaverse dan Web3-bidang berkaitan. Artikelnya menarik khalayak besar lebih sejuta pengguna setiap bulan. Dia nampaknya seorang pakar dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebut dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto dan penerbitan lain. Dia mengembara antara UAE, Turki, Rusia dan CIS sebagai nomad digital. Damir memperoleh ijazah sarjana muda dalam fizik, yang dia percaya telah memberikannya kemahiran berfikir kritis yang diperlukan untuk berjaya dalam landskap internet yang sentiasa berubah. 

lebih banyak artikel
Damir Yalalov
Damir Yalalov

Damir ialah ketua pasukan, pengurus produk dan editor di Metaverse Post, meliputi topik seperti AI/ML, AGI, LLM, Metaverse dan Web3-bidang berkaitan. Artikelnya menarik khalayak besar lebih sejuta pengguna setiap bulan. Dia nampaknya seorang pakar dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebut dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto dan penerbitan lain. Dia mengembara antara UAE, Turki, Rusia dan CIS sebagai nomad digital. Damir memperoleh ijazah sarjana muda dalam fizik, yang dia percaya telah memberikannya kemahiran berfikir kritis yang diperlukan untuk berjaya dalam landskap internet yang sentiasa berubah. 

Selera Institusi Berkembang Terhadap Bitcoin ETF Di Tengah-tengah Kemeruapan

Pendedahan melalui pemfailan 13F mendedahkan pelabur institusi terkenal yang berkecimpung dalam Bitcoin ETF, menekankan penerimaan yang semakin meningkat terhadap ...

Mengetahui lebih lanjut

Hari Penghukuman Tiba: Nasib CZ Bergantung Seimbang apabila Mahkamah AS Mempertimbangkan Rayuan DOJ

Changpeng Zhao bersedia untuk menghadapi hukuman di mahkamah AS di Seattle hari ini.

Mengetahui lebih lanjut
Sertai Komuniti Teknologi Inovatif Kami
Lebih Lanjut
Maklumat Lanjut
Inside Wall Street Memes (WSM): Membongkar Tajuk Berita
Perniagaan pasaran Cerita dan Ulasan Teknologi
Inside Wall Street Memes (WSM): Membongkar Tajuk Berita
Semoga 7, 2024
Temui Paus Kripto: Siapa Siapa di Pasaran
Perniagaan pasaran Cerita dan Ulasan Teknologi
Temui Paus Kripto: Siapa Siapa di Pasaran
Semoga 7, 2024
Orbiter Finance Bekerjasama Dengan Bitcoin Layer 2 Zulu Network Dan Digunakan Pada Is Lwazi Testnet
Perniagaan Laporan Berita Teknologi
Orbiter Finance Bekerjasama Dengan Bitcoin Layer 2 Zulu Network Dan Digunakan Pada Is Lwazi Testnet 
Semoga 7, 2024
Crypto Exchange Bybit Mengintegrasikan Ethena Labs' USDe Sebagai Aset Cagaran, Membolehkan Pasangan Dagangan BTC-USDe dan ETH-USDe
pasaran Laporan Berita Teknologi
Crypto Exchange Bybit Mengintegrasikan Ethena Labs' USDe Sebagai Aset Cagaran, Membolehkan Pasangan Dagangan BTC-USDe dan ETH-USDe
Semoga 7, 2024