Notizie Tecnologia
31 Maggio 2023

Guanaco emerge come potenziale open-source ChatGPT Concorrente

In Breve

Guanaco, un chatbot open source sviluppato dai ricercatori dell'Università di Washington, aspira a competere ChatGPT pur richiedendo meno tempo e denaro per la formazione.

Un nuovo studio, tuttavia, ha messo in dubbio l'efficacia di modelli come Alpaca.

Lo hanno svelato i ricercatori dell'Università di Washington guanaco, un chatbot open source che mira a competere con le prestazioni di ChatGPT riducendo significativamente il tempo e le risorse necessarie per la formazione. Prende il nome da un parente sudamericano di llamas, Guanaco è costruito sul LLaMA modello linguistico e incorpora un nuovo metodo di messa a punto chiamato QLoRA.

Guanaco emerge come potenziale open-source ChatGPT Concorrente
Metaverse Post (mpost.io)

I creatori di Guanaco affermano che raggiunge prestazioni paragonabili a ChatGPT ma può essere addestrato in un solo giorno. Questa straordinaria impresa è resa possibile da QLoRA, una tecnica di messa a punto del modello linguistico che riduce sostanzialmente la quantità di memoria GPU necessaria per l'addestramento. Mentre ChatGPT richiede ben 780 GB di memoria GPU per un modello con 65 miliardi di parametri, la versione più semplice di Guanaco richiede solo 5 GB.

Con questi straordinari guadagni di efficienza, Guanaco e simili modelli open source stanno sfidando l'idea per cui è necessaria una formazione costosa modelli linguistici all'avanguardia. L'emergere di Guanaco, Alpacae altri modelli quel treno a una frazione del costo ha portato a speculazioni sul futuro di modelli costosi come GPT.

Tuttavia, non tutti sono d'accordo con questa visione ottimistica dei modelli open source. Un recente studio condotto dall'Università della California ha messo in dubbio sulle capacità di modelli come gli alpaca e ha sollevato dubbi sul loro vero potenziale. Inizialmente, i ricercatori sono giunti a una conclusione simile a quella dei creatori di Guanaco: se adeguatamente formati, i modelli open source possono competere GPT nelle capacità. Ulteriori test hanno rivelato una limitazione significativa. Questi modelli “Dolly”, come vengono talvolta chiamati, sono abili nell’imitare soluzioni ai problemi incontrati durante l’allenamento. Tuttavia, faticano a svolgere bene compiti a cui non sono stati esplicitamente esposti, rimanendo indietro rispetto ai modelli più avanzati.

Questa rivelazione suggerisce che il milioni investiti nella formazione GPT e modelli simili potrebbero non essere stati vani. Mentre Guanaco e le sue controparti dimostrano risultati promettenti, ci sono ancora aree in cui i modelli più sofisticati eccellono. Vale la pena notare che il ricerca condotta dall'Università della California sfida l'idea prevalente secondo cui i modelli open source possono sostituire completamente modelli costosi come GPT.

Man mano che il campo dell'elaborazione del linguaggio naturale si evolve, sarà interessante osservare come Guanaco e altri modelli open-source si equivalgono rispetto a quelli consolidati benchmark come ChatGPT. L'alto tasso di innovazione e la continua ricerca avranno, senza dubbio, un impatto sul futuro dei modelli linguistici e determineranno quali modelli diventeranno la scelta ideale per applicazioni particolari.

  • Dolly 2.0, il primo Chat-LLM open source 12B disponibile in commercio, è stato annunciato di Databricks. Si tratta di un progresso significativo per il settore del machine learning, che consente alle aziende di creare modelli linguistici efficaci senza investire in costosi cluster GPU. Databricks ha coinvolto 5,000 dipendenti per creare il proprio modello linguistico open source, che includeva il modello linguistico Pythia-12B di EleutherAI con una licenza MIT. Dolly 2.0, così come il codice associato, è disponibile con licenza MIT. Dolly 2.0 ha il potenziale per cambiare il settore ed è un significativo passo avanti per l'apprendimento automatico.

Per saperne di più sull'intelligenza artificiale:

Negazione di responsabilità

In linea con la Linee guida del progetto Trust, si prega di notare che le informazioni fornite in questa pagina non intendono essere e non devono essere interpretate come consulenza legale, fiscale, di investimento, finanziaria o di qualsiasi altra forma. È importante investire solo ciò che puoi permetterti di perdere e chiedere una consulenza finanziaria indipendente in caso di dubbi. Per ulteriori informazioni, suggeriamo di fare riferimento ai termini e alle condizioni nonché alle pagine di aiuto e supporto fornite dall'emittente o dall'inserzionista. MetaversePost si impegna a fornire report accurati e imparziali, ma le condizioni di mercato sono soggette a modifiche senza preavviso.

Circa l'autore

Damir è il team leader, il product manager e l'editore di Metaverse Post, che copre argomenti come AI/ML, AGI, LLM, Metaverse e Web3campi correlati. I suoi articoli attirano un vasto pubblico di oltre un milione di utenti ogni mese. Sembra essere un esperto con 10 anni di esperienza in SEO e marketing digitale. Damir è stato menzionato in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e altre pubblicazioni. Viaggia tra Emirati Arabi Uniti, Turchia, Russia e CSI come nomade digitale. Damir ha conseguito una laurea in fisica, che secondo lui gli ha fornito le capacità di pensiero critico necessarie per avere successo nel panorama in continua evoluzione di Internet. 

Altri articoli
Damir Jalalov
Damir Jalalov

Damir è il team leader, il product manager e l'editore di Metaverse Post, che copre argomenti come AI/ML, AGI, LLM, Metaverse e Web3campi correlati. I suoi articoli attirano un vasto pubblico di oltre un milione di utenti ogni mese. Sembra essere un esperto con 10 anni di esperienza in SEO e marketing digitale. Damir è stato menzionato in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e altre pubblicazioni. Viaggia tra Emirati Arabi Uniti, Turchia, Russia e CSI come nomade digitale. Damir ha conseguito una laurea in fisica, che secondo lui gli ha fornito le capacità di pensiero critico necessarie per avere successo nel panorama in continua evoluzione di Internet. 

Cresce l’appetito istituzionale verso gli ETF Bitcoin in un contesto di volatilità

Le informazioni fornite tramite la documentazione 13F rivelano importanti investitori istituzionali che si dilettano negli ETF Bitcoin, sottolineando una crescente accettazione di...

Per saperne di più

Arriva il giorno della sentenza: il destino di CZ è in bilico mentre la Corte degli Stati Uniti considera l'appello del Dipartimento di Giustizia

Changpeng Zhao è pronto ad affrontare oggi la sentenza in un tribunale americano a Seattle.

Per saperne di più
Unisciti alla nostra comunità tecnologica innovativa
Scopri di più
Per saperne di più
Inside Wall Street Memes (WSM): svelare i titoli dei giornali
Affari Mercati Storie e recensioni Tecnologia
Inside Wall Street Memes (WSM): svelare i titoli dei giornali
7 Maggio 2024
Scopri le Crypto Whales: chi è chi nel mercato
Affari Mercati Storie e recensioni Tecnologia
Scopri le Crypto Whales: chi è chi nel mercato
7 Maggio 2024
Orbiter Finance collabora con la rete Zulu Bitcoin Layer 2 e si distribuisce su Is Lwazi Testnet
Affari Notizie Tecnologia
Orbiter Finance collabora con la rete Zulu Bitcoin Layer 2 e si distribuisce su Is Lwazi Testnet 
7 Maggio 2024
L'exchange di criptovalute Bybit integra USDe di Ethena Labs come risorsa collaterale e consente coppie di trading BTC-USDe ed ETH-USDe
Mercati Notizie Tecnologia
L'exchange di criptovalute Bybit integra USDe di Ethena Labs come risorsa collaterale e consente coppie di trading BTC-USDe ed ETH-USDe
7 Maggio 2024
LABORATORI DI CRITTOMERIA PTE. srl.