Notizie Tecnologia
02 Maggio 2023

MLCopilot: sfrutta la potenza degli LLM per aiutare gli sviluppatori nelle loro attività di ML

In Breve

MLCopilot è un nuovo modo di utilizzare i modelli di machine learning per risolvere compiti impegnativi, automatizzando il processo di selezione di parametri e architetture.

Opera su due livelli, offline e online, estraendo conoscenza da centinaia di esperimenti di apprendimento automatico e applicando uno speciale prompt per generare una decisione.

Fornisce vantaggi tangibili come la velocità di esecuzione e la riduzione del costo del lavoro.

I modelli di apprendimento automatico sono stati utilizzati per risolvere vari compiti; tuttavia, la loro formazione è stata per lo più un processo manuale. La sfida era selezionare i parametri e le architetture giuste per ottenere i migliori risultati poiché il processo richiede notevole know-how ed esperienza. Con l'avvento di tecnologie avanzate e modelli linguistici di grandi dimensioni (LLM), come GPT-3.5, questo processo può ora essere automatizzato. Ciò apre un nuovo modo di utilizzare la potenza dei modelli di machine learning nella risoluzione di compiti impegnativi: MLCopilot.

MLCopilot: sfrutta la potenza degli LLM per aiutare gli sviluppatori nelle loro attività di ML
@Midjourney /roypolloi#4804
Leggi di più: 8 cose che dovresti sapere sui modelli linguistici di grandi dimensioni

MLCopilot opera su due livelli. Sul lato offline, entità come l'intento e l'architettura del modello sono unificate, con la conoscenza estratta da centinaia di esperimenti di machine learning. Questi dati costituiscono la base di conoscenza su cui lavora MLCopilot. Sul lato online, MLCopilot applica un prompt speciale, inclusi esempi pertinenti di esperimenti precedenti, per generare una decisione sull'approccio migliore per risolvere un determinato compito. Tali decisioni si sono rivelate più accurate di quelle prese da persone che selezionano e applicano manualmente algoritmi collaudati.

Una richiesta specifica viene inserita più avanti in linea GPT-3.5
Un prompt specifico viene ulteriormente guidato online GPT-3.5 (nemmeno ChatGPT, e ancor meno il GPT-4) e i campioni idonei provenienti da lavori simili vengono automaticamente inseriti al suo interno. L'assistente prende quindi una decisione su come e cosa fare. Seguendo le indicazioni, gli utenti hanno prodotto modelli addestrati di qualità superiore rispetto a quelli proposti in precedenza e metodi appositamente adattati (ad esempio, enumerazione intelligente dei parametri anziché casuale).

Oltre a prendere decisioni più accurate, MLCopilot offre vantaggi tangibili come velocità di esecuzione e riduzione dei costi di manodopera. D'altra parte, vanno tenuti presenti alcuni inconvenienti, ad esempio la necessità di dati ad alta precisione per formare la base di conoscenza e la necessità di mantenere il modello aggiornato con nuovi esperimenti.

È interessante notare che le stime degli esperimenti della storia sono state tradotte in valori relativi senza numeri: "molto basso", "basso", "medio", "alto" e "molto alto". Sulla base di ciò, il modello potrebbe determinare cosa funziona e cosa no.

Il modello ha accesso a centinaia di migliaia di tali fatti tramite una memoria esterna (Retriever) e propone di sperimentare nuovi dati e compiti basati su queste conclusioni generalizzate.
Il modello ha accesso a centinaia di migliaia di tali fatti tramite una memoria esterna (Retriever); propone di sperimentare nuovi dati e compiti basati su queste conclusioni generalizzate.

Nel complesso, MLCopilot ha il potenziale per migliorare il modo in cui vengono risolte le attività di machine learning. Selezionando automaticamente i parametri e l'architettura giusti, ci consente di sfruttare la potenza dei modelli di machine learning per risparmiare tempo e costi migliorando al contempo la precisione. In definitiva, questi benefici andranno a beneficio di tutti: dai singoli ricercatori alle grandi aziende o organizzazioni statali. Questo è un enorme balzo in avanti per l'era dell'IA e sarà sicuramente seguito da sviluppi più entusiasmanti.

L'articolo termina con una nota spaventosa per alcuni e una nota motivante per altri: "Speriamo che il design del nostro metodo possa servire da ispirazione per la comunità più ampia e contribuire al progresso degli LLM verso l'obiettivo di raggiungere l'intelligenza artificiale generale ( AGI).”

  • A marzo 14, OpenAI ha annunciato il lancio di GPT-4, una versione aggiornata del suo modello di intelligenza artificiale GPT-3.5. Ha raggiunto una soglia elevata, sovraperformando GPT-3.5 su vari parametri di studio.

Per saperne di più sull'intelligenza artificiale:

Negazione di responsabilità

In linea con la Linee guida del progetto Trust, si prega di notare che le informazioni fornite in questa pagina non intendono essere e non devono essere interpretate come consulenza legale, fiscale, di investimento, finanziaria o di qualsiasi altra forma. È importante investire solo ciò che puoi permetterti di perdere e chiedere una consulenza finanziaria indipendente in caso di dubbi. Per ulteriori informazioni, suggeriamo di fare riferimento ai termini e alle condizioni nonché alle pagine di aiuto e supporto fornite dall'emittente o dall'inserzionista. MetaversePost si impegna a fornire report accurati e imparziali, ma le condizioni di mercato sono soggette a modifiche senza preavviso.

Circa l'autore

Damir è il team leader, il product manager e l'editore di Metaverse Post, che copre argomenti come AI/ML, AGI, LLM, Metaverse e Web3campi correlati. I suoi articoli attirano un vasto pubblico di oltre un milione di utenti ogni mese. Sembra essere un esperto con 10 anni di esperienza in SEO e marketing digitale. Damir è stato menzionato in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e altre pubblicazioni. Viaggia tra Emirati Arabi Uniti, Turchia, Russia e CSI come nomade digitale. Damir ha conseguito una laurea in fisica, che secondo lui gli ha fornito le capacità di pensiero critico necessarie per avere successo nel panorama in continua evoluzione di Internet. 

Altri articoli
Damir Jalalov
Damir Jalalov

Damir è il team leader, il product manager e l'editore di Metaverse Post, che copre argomenti come AI/ML, AGI, LLM, Metaverse e Web3campi correlati. I suoi articoli attirano un vasto pubblico di oltre un milione di utenti ogni mese. Sembra essere un esperto con 10 anni di esperienza in SEO e marketing digitale. Damir è stato menzionato in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e altre pubblicazioni. Viaggia tra Emirati Arabi Uniti, Turchia, Russia e CSI come nomade digitale. Damir ha conseguito una laurea in fisica, che secondo lui gli ha fornito le capacità di pensiero critico necessarie per avere successo nel panorama in continua evoluzione di Internet. 

La frenesia del DOGE: analisi del recente aumento di valore di Dogecoin (DOGE).

L’industria delle criptovalute è in rapida espansione e le monete meme si stanno preparando per una significativa ripresa. Dogecoin (DOGE), ...

Per saperne di più

L'evoluzione dei contenuti generati dall'intelligenza artificiale nel Metaverso

L’emergere di contenuti di intelligenza artificiale generativa è uno degli sviluppi più affascinanti all’interno dell’ambiente virtuale…

Per saperne di più
Unisciti alla nostra comunità tecnologica innovativa
Scopri di più
Per saperne di più
Le migliori offerte di questa settimana, i principali investimenti in AI, IT, Web3e Criptovaluta (22-26.04)
digerire Affari Mercati Tecnologia
Le migliori offerte di questa settimana, i principali investimenti in AI, IT, Web3e Criptovaluta (22-26.04)
26 aprile 2024
Vitalik Buterin commenta la centralizzazione del PoW, sottolineando che si trattava di una fase temporanea fino al PoS
Notizie Tecnologia
Vitalik Buterin commenta la centralizzazione del PoW, sottolineando che si trattava di una fase temporanea fino al PoS
26 aprile 2024
Offchain Labs rivela la scoperta di due vulnerabilità critiche nelle prove di frode dello stack OP di Optimism
Notizie Software Tecnologia
Offchain Labs rivela la scoperta di due vulnerabilità critiche nelle prove di frode dello stack OP di Optimism
26 aprile 2024
Il mercato aperto di Dymension per colmare la liquidità da RollApps eIBC viene lanciato su Mainnet
Notizie Tecnologia
Il mercato aperto di Dymension per colmare la liquidità da RollApps eIBC viene lanciato su Mainnet 
26 aprile 2024
LABORATORI DI CRITTOMERIA PTE. srl.