02 Maggio 2023

MLCopilot: sfrutta la potenza degli LLM per aiutare gli sviluppatori nelle loro attività di ML

Pubblicato: 02 maggio 2023 alle 8:20 Aggiornato: 02 maggio 2023 alle 9:03

In Breve

MLCopilot è un nuovo modo di utilizzare i modelli di machine learning per risolvere compiti impegnativi, automatizzando il processo di selezione di parametri e architetture.

Opera su due livelli, offline e online, estraendo conoscenza da centinaia di esperimenti di apprendimento automatico e applicando uno speciale prompt per generare una decisione.

Fornisce vantaggi tangibili come la velocità di esecuzione e la riduzione del costo del lavoro.

I modelli di apprendimento automatico sono stati utilizzati per risolvere vari compiti; tuttavia, la loro formazione è stata per lo più un processo manuale. La sfida era selezionare i parametri e le architetture giuste per ottenere i migliori risultati poiché il processo richiede notevole know-how ed esperienza. Con l'avvento di tecnologie avanzate e modelli linguistici di grandi dimensioni (LLM), come GPT-3.5, questo processo può ora essere automatizzato. Ciò apre un nuovo modo di utilizzare la potenza dei modelli di machine learning nella risoluzione di compiti impegnativi: MLCopilot.

MLCopilot: sfrutta la potenza degli LLM per aiutare gli sviluppatori nelle loro attività di ML — @Midjourney /roypolloi#4804

Leggi di più: 8 cose che dovresti sapere sui modelli linguistici di grandi dimensioni

MLCopilot opera su due livelli. Sul lato offline, entità come l'intento e l'architettura del modello sono unificate, con la conoscenza estratta da centinaia di esperimenti di machine learning. Questi dati costituiscono la base di conoscenza su cui lavora MLCopilot. Sul lato online, MLCopilot applica un prompt speciale, inclusi esempi pertinenti di esperimenti precedenti, per generare una decisione sull'approccio migliore per risolvere un determinato compito. Tali decisioni si sono rivelate più accurate di quelle prese da persone che selezionano e applicano manualmente algoritmi collaudati.

Una richiesta specifica viene inserita più avanti in linea GPT-3.5 — Un prompt specifico viene ulteriormente guidato online GPT-3.5 (nemmeno ChatGPT, e ancor meno il GPT-4) e i campioni idonei provenienti da lavori simili vengono automaticamente inseriti al suo interno. L'assistente prende quindi una decisione su come e cosa fare. Seguendo le indicazioni, gli utenti hanno prodotto modelli addestrati di qualità superiore rispetto a quelli proposti in precedenza e metodi appositamente adattati (ad esempio, enumerazione intelligente dei parametri anziché casuale).

Oltre a prendere decisioni più accurate, MLCopilot offre vantaggi tangibili come velocità di esecuzione e riduzione dei costi di manodopera. D'altra parte, vanno tenuti presenti alcuni inconvenienti, ad esempio la necessità di dati ad alta precisione per formare la base di conoscenza e la necessità di mantenere il modello aggiornato con nuovi esperimenti.

È interessante notare che le stime degli esperimenti della storia sono state tradotte in valori relativi senza numeri: "molto basso", "basso", "medio", "alto" e "molto alto". Sulla base di ciò, il modello potrebbe determinare cosa funziona e cosa no.

Il modello ha accesso a centinaia di migliaia di tali fatti tramite una memoria esterna (Retriever) e propone di sperimentare nuovi dati e compiti basati su queste conclusioni generalizzate. — Il modello ha accesso a centinaia di migliaia di tali fatti tramite una memoria esterna (Retriever); propone di sperimentare nuovi dati e compiti basati su queste conclusioni generalizzate.

Nel complesso, MLCopilot ha il potenziale per migliorare il modo in cui vengono risolte le attività di machine learning. Selezionando automaticamente i parametri e l'architettura giusti, ci consente di sfruttare la potenza dei modelli di machine learning per risparmiare tempo e costi migliorando al contempo la precisione. In definitiva, questi benefici andranno a beneficio di tutti: dai singoli ricercatori alle grandi aziende o organizzazioni statali. Questo è un enorme balzo in avanti per l'era dell'IA e sarà sicuramente seguito da sviluppi più entusiasmanti.

L'articolo termina con una nota spaventosa per alcuni e una nota motivante per altri: "Speriamo che il design del nostro metodo possa servire da ispirazione per la comunità più ampia e contribuire al progresso degli LLM verso l'obiettivo di raggiungere l'intelligenza artificiale generale ( AGI).”

A marzo 14, OpenAI ha annunciato il lancio di GPT-4, una versione aggiornata del suo modello di intelligenza artificiale GPT-3.5. Ha raggiunto una soglia elevata, sovraperformando GPT-3.5 su vari parametri di studio.

Per saperne di più sull'intelligenza artificiale:

Tag:

Negazione di responsabilità

In linea con la Linee guida del progetto Trust, si prega di notare che le informazioni fornite in questa pagina non intendono essere e non devono essere interpretate come consulenza legale, fiscale, di investimento, finanziaria o di qualsiasi altra forma. È importante investire solo ciò che puoi permetterti di perdere e chiedere una consulenza finanziaria indipendente in caso di dubbi. Per ulteriori informazioni, suggeriamo di fare riferimento ai termini e alle condizioni nonché alle pagine di aiuto e supporto fornite dall'emittente o dall'inserzionista. MetaversePost si impegna a fornire report accurati e imparziali, ma le condizioni di mercato sono soggette a modifiche senza preavviso.

Circa l'autore

Damir è il team leader, il product manager e l'editore di Metaverse Post, che copre argomenti come AI/ML, AGI, LLM, Metaverse e Web3campi correlati. I suoi articoli attirano un vasto pubblico di oltre un milione di utenti ogni mese. Sembra essere un esperto con 10 anni di esperienza in SEO e marketing digitale. Damir è stato menzionato in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e altre pubblicazioni. Viaggia tra Emirati Arabi Uniti, Turchia, Russia e CSI come nomade digitale. Damir ha conseguito una laurea in fisica, che secondo lui gli ha fornito le capacità di pensiero critico necessarie per avere successo nel panorama in continua evoluzione di Internet.

Altri articoli

Damir Jalalov