Istraživači Carnegie Mellon predstavljaju MLC LLM za pokretanje jezičnih modela na bilo kojem uređaju
Ukratko
MLC LLM i Web LLM omogućuju korisnicima implementaciju jezični modeli na bilo kojem uređaju, omogućujući nove aplikacije i upotrebe za razumijevanje prirodnog jezika.
Predstavili su istraživači Sveučilišta Carnegie Mellon MLC LLM, skup alata koji bi mogli revolucionirati način na koji se jezični modeli izvode na bilo kojem uređaju. Takvi modeli omogućuju korisnicima stvaranje niza aplikacija na prirodnom jeziku, poput virtualnih pomoćnika i pametnih chatbota. Kroz zasebne optimizacije performansi, MLC LLM sada se može koristiti na različitim platformama i scenarijima.
Pročitajte više: 10 najboljih sveučilišta za proučavanje umjetne inteligencije |
Novi alat, poznat kao Web LLM, također je dio ove inicijative. Omogućuje pokretanje jezičnih modela izravno u pregledniku, što znači da korisnici ne moraju ručno preuzimati sustav, koji može biti velik nekoliko gigabajta. Tako je nastao model Vicuna 7B koji ima 7 milijardi parametara. Ovo može biti iznimno korisno pri dizajniranju prikladnijih virtualnih pomoćnika i chatbota budući da zahtijevaju veliku količinu parametara.
Koristeći MLC LLM i Web LLM, sada je moguće implementirati bilo koji jezični model po izboru na bilo kojem uređaju. Istraživači s Carnegie Mellon izvijestili su da bi ovo otvorilo niz aplikacija koje prije nisu bile moguće. Bilo koje jezični model sada se mogu postaviti na razne računalne uređaje, poput prijenosnih računala i telefona, ili čak procesore i video akceleratore. Ovo otvara svijet mogućnosti za obradu prirodnog jezika i stroj za učenje.
Nova inicijativa Carnegie Mellona utire put nizu novih aplikacija i upotreba za razumijevanje prirodnog jezika. Budući da ove jezične modele možete koristiti na bilo kojem uređaju, puno je lakše implementirati takvu tehnologiju u mnogo različitih scenarija. Bilo da se radi o virtualnim pomoćnicima ili automatiziranoj korisničkoj službi, ovaj bi novi alat mogao imati drastičan utjecaj na način na koji se ti zadaci obavljaju.
Istraživački tim Carnegie Mellon razvio je MLC LLM za pokretanje na bilo kojem uređaju, uključujući iPhone i druge pametne kućne uređaje, s modernim procesorom i 6 GB ili više RAM-a. Ovaj pojednostavljeni pristup znači da uređaji sada mogu pokretati jezične modele brzinom generiranja gotovo u stvarnom vremenu, čak i kada ih optimiziraju vanjski programeri, a ne Appleovi inženjeri.
Osim što omogućuje prirodnu interakciju s proizvodima, MLC LLM također se može koristiti za optimiziranje zadataka upravljanja uređajem. Sa samo 4 GB do 6 GB RAM-a potrebnih za rad, ovaj revolucionarni jezični model bit će izvrstan dodatak budućim modelima iPhonea i potencijalno bi se mogao uvesti u proizvodnju bez dugotrajnog razvojni proces.
Uvođenjem MLC LLM jezični model, istraživači Carnegie Mellon stvorili su učinkovit i robustan način za pokretanje jezičnih modela na bilo kojem uređaju. MLC LLM sustav je otkriće u obradi prirodnog jezika i omogućit će korisnicima za učinkovitiju prirodnu interakciju sa svojim uređajima. Također ima potencijal značajno ubrzati razvojni proces za buduće zadatke upravljanja uređajima. Mogućnosti su beskrajne uz MLC LLM, a rad Carnegieja Mellona sigurno hoće transformirati način na koji razmišljamo o jezičnim modelima za bolje.
Pročitajte više o AI:
Izjava o odricanju od odgovornosti
U skladu s Smjernice projekta povjerenja, imajte na umu da informacije navedene na ovoj stranici nemaju namjeru i ne smiju se tumačiti kao pravni, porezni, investicijski, financijski ili bilo koji drugi oblik savjeta. Važno je ulagati samo ono što si možete priuštiti izgubiti i potražiti neovisni financijski savjet ako imate bilo kakvih nedoumica. Za dodatne informacije predlažemo da pogledate odredbe i uvjete, kao i stranice za pomoć i podršku koje pruža izdavatelj ili oglašivač. MetaversePost je predan točnom, nepristranom izvješćivanju, ali tržišni uvjeti podložni su promjenama bez prethodne najave.
O autoru
Damir je voditelj tima, product manager i urednik u Metaverse Post, koji pokriva teme kao što su AI/ML, AGI, LLMs, Metaverse i Web3- srodna polja. Njegovi članci privlače ogromnu publiku od preko milijun korisnika svakog mjeseca. Čini se da je stručnjak s 10 godina iskustva u SEO-u i digitalnom marketingu. Damir je spomenut u Mashableu, Wiredu, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i druge publikacije. Putuje između UAE, Turske, Rusije i CIS-a kao digitalni nomad. Damir je stekao diplomu prvostupnika fizike, za koju vjeruje da mu je dala vještine kritičkog razmišljanja potrebne za uspjeh u stalno promjenjivom okruženju interneta.
Više članakaDamir je voditelj tima, product manager i urednik u Metaverse Post, koji pokriva teme kao što su AI/ML, AGI, LLMs, Metaverse i Web3- srodna polja. Njegovi članci privlače ogromnu publiku od preko milijun korisnika svakog mjeseca. Čini se da je stručnjak s 10 godina iskustva u SEO-u i digitalnom marketingu. Damir je spomenut u Mashableu, Wiredu, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i druge publikacije. Putuje između UAE, Turske, Rusije i CIS-a kao digitalni nomad. Damir je stekao diplomu prvostupnika fizike, za koju vjeruje da mu je dala vještine kritičkog razmišljanja potrebne za uspjeh u stalno promjenjivom okruženju interneta.