Guanaco Potansiyel Bir Açık Kaynak Olarak Ortaya Çıkıyor ChatGPT Rakip
Kısaca
Washington Üniversitesi araştırmacıları tarafından geliştirilen açık kaynaklı bir sohbet robotu olan Guanaco, rekabet etmeyi hedefliyor ChatGPT eğitim için daha az zaman ve para gerektirirken.
Ancak yeni bir çalışma, Alpaka gibi modellerin etkinliğini sorguladı.
Washington Üniversitesi'nden araştırmacılar açıkladı Guanakoperformansına rakip olmayı amaçlayan açık kaynaklı bir sohbet robotu ChatGPT eğitim için gereken zamanı ve kaynakları önemli ölçüde azaltırken. Adını Güney Amerikalı bir akrabasından alıyor llamaGuanaco, LLaMA dil modelidir ve QLoRA adı verilen yeni bir ince ayar yöntemini içerir.
Guanaco'nun yaratıcıları, Guanaco'nun benzer performansa ulaştığını iddia ediyor ChatGPT ancak tek bir günde eğitilebilir. Bu olağanüstü başarı, eğitim için gereken GPU belleği miktarını önemli ölçüde azaltan bir dil modeli ince ayar tekniği olan QLoRA ile mümkün kılındı. Sırasında ChatGPT 780 GB'lık muazzam bir GPU belleği gerektirir 65 milyar parametreli bir model için Guanaco'nun en basit versiyonu sadece 5 GB gerektirir.
Bu etkileyici verimlilik kazanımlarıyla, Guanaco ve benzeri açık kaynaklı modeller, aşağıdakiler için pahalı eğitimin gerekli olduğu fikrine meydan okuyor: son teknoloji dil modelleri. Guanaco'nun ortaya çıkışı, Alpaka, ve diğer modeller maliyetinin çok altında bir fiyatla tren gibi pahalı modellerin geleceği hakkında spekülasyonlara yol açtı GPT.
Ancak, herkes açık kaynak modellerine ilişkin bu iyimser görüşe katılmıyor. Kaliforniya Üniversitesi tarafından yürütülen yeni bir çalışma şüphe uyandırdı alpaka gibi modellerin yetenekleri hakkında bilgi verdi ve onların gerçek potansiyelleri hakkında sorular sordu. Başlangıçta araştırmacılar Guanaco'nun yaratıcılarıyla benzer bir sonuca ulaştı: Doğru şekilde eğitildiğinde açık kaynaklı modeller rakip olabilir GPT yeteneklerde. Daha ileri testler önemli bir sınırlamayı ortaya çıkardı. Bazen "Dolly" olarak da adlandırılan bu modeller, eğitim sırasında karşılaştıkları sorunların çözümlerini taklit etme konusunda ustadır. Ancak, daha gelişmiş modellerin gerisinde kalarak, açıkça maruz kalmadıkları görevlerde iyi performans gösterme konusunda zorluk yaşıyorlar.
Bu ifşa gösteriyor ki, Milyonlarca eğitime yatırım yapıldı GPT ve benzer modeller boşuna olmayabilir. Guanaco ve muadilleri umut verici sonuçlar gösterse de, daha gelişmiş modellerin öne çıktığı alanlar hala var. belirtmekte fayda var ki, Kaliforniya Üniversitesi tarafından yürütülen araştırma Açık kaynaklı modellerin, aşağıdaki gibi pahalı modellerin yerini tamamen alabileceği yönündeki yaygın düşünceye meydan okuyor: GPT.
Doğal dil işleme alanı geliştikçe, Guanaco ve diğer açık kaynak modellerinin kurulu olanlara karşı nasıl adil olduğunu izlemek ilginç olacak. gibi kriterler ChatGPT. Yüksek yenilik oranı ve sürekli araştırma, şüphesiz dil modellerinin geleceğini etkileyecek ve belirli uygulamalar için hangi modellerin tercih edileceğini belirleyecektir.
- Dolly 2.0, piyasada bulunan ilk açık kaynaklı 12B Chat-LLM, ilan edildi Databricks tarafından. Bu, makine öğrenimi endüstrisi için önemli bir ilerlemedir ve işletmelerin maliyetli GPU kümelerine yatırım yapmadan etkili dil modelleri oluşturmasına olanak tanır. Databricks, EleutherAI'nin bir MIT lisansı altındaki Pythia-5,000B dil modelini içeren açık kaynak dil modelini oluşturmak için 12 çalışanı işe aldı. Dolly 2.0 ve ilgili kod, bir MIT lisansı altında mevcuttur. Dolly 2.0, sektörü değiştirme potansiyeline sahiptir ve makine öğrenimi için önemli bir adımdır.
AI hakkında daha fazlasını okuyun:
Feragatname
Doğrultusunda Trust Project yönergeleri, lütfen bu sayfada sağlanan bilgilerin hukuki, vergi, yatırım, finansal veya başka herhangi bir tavsiye niteliğinde olmadığını ve bu şekilde yorumlanmaması gerektiğini unutmayın. Yalnızca kaybetmeyi göze alabileceğiniz kadar yatırım yapmak ve herhangi bir şüpheniz varsa bağımsız finansal tavsiye almak önemlidir. Daha fazla bilgi için şartlar ve koşulların yanı sıra kartı veren kuruluş veya reklamveren tarafından sağlanan yardım ve destek sayfalarına bakmanızı öneririz. MetaversePost doğru, tarafsız raporlamaya kendini adamıştır, ancak piyasa koşulları önceden haber verilmeksizin değiştirilebilir.
Yazar hakkında
Damir şu anda ekip lideri, ürün yöneticisi ve editördür: Metaverse Post, AI/ML, AGI, LLM'ler, Metaverse ve Web3-İlgili alanlar. Makaleleri, her ay bir milyondan fazla kullanıcıdan oluşan büyük bir kitleyi kendine çekiyor. SEO ve dijital pazarlama konusunda 10 yıllık deneyime sahip bir uzman gibi görünüyor. Damir'den Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ve diğer yayınlar. Dijital bir göçebe olarak BAE, Türkiye, Rusya ve BDT arasında seyahat ediyor. Damir, kendisine internetin sürekli değişen ortamında başarılı olmak için gereken eleştirel düşünme becerilerini verdiğine inandığı fizik alanında lisans derecesi aldı.
Daha fazla haberDamir şu anda ekip lideri, ürün yöneticisi ve editördür: Metaverse Post, AI/ML, AGI, LLM'ler, Metaverse ve Web3-İlgili alanlar. Makaleleri, her ay bir milyondan fazla kullanıcıdan oluşan büyük bir kitleyi kendine çekiyor. SEO ve dijital pazarlama konusunda 10 yıllık deneyime sahip bir uzman gibi görünüyor. Damir'den Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ve diğer yayınlar. Dijital bir göçebe olarak BAE, Türkiye, Rusya ve BDT arasında seyahat ediyor. Damir, kendisine internetin sürekli değişen ortamında başarılı olmak için gereken eleştirel düşünme becerilerini verdiğine inandığı fizik alanında lisans derecesi aldı.