Výskumníci z Carnegie Mellon predstavujú MLC LLM pre spustenie jazykových modelov na akomkoľvek zariadení
Stručne
MLC LLM a Web LLM umožňujú používateľom nasadenie jazykové modely na akomkoľvek zariadení, čo umožňuje nové aplikácie a spôsoby využitia na pochopenie prirodzeného jazyka.
Uviedli to vedci z Carnegie Mellon University MLC LLM, súbor nástrojov, ktoré by mohli spôsobiť revolúciu v tom, ako fungujú jazykové modely na akomkoľvek zariadení. Takéto modely umožňujú používateľom vytvárať celý rad aplikácií v prirodzenom jazyku, ako sú virtuálni asistenti a inteligentné chatboty. Prostredníctvom samostatných optimalizácií výkonu možno teraz MLC LLM používať na rôznych platformách a scenároch.
Prečítajte si viac: 10 najlepších univerzít na štúdium umelej inteligencie |
Nový nástroj, známy ako Web LLM, je tiež súčasťou tejto iniciatívy. Umožňuje spustenie jazykových modelov priamo v prehliadači, čo znamená, že používatelia nemusia manuálne sťahovať systém, ktorý môže mať veľkosť niekoľkých gigabajtov. Takto vznikol model Vicuna 7B, ktorý má 7 miliárd parametrov. To môže byť mimoriadne užitočné pri navrhovaní vhodnejších virtuálnych asistentov a chatbotov, pretože vyžadujú veľké množstvo parametrov.
Pomocou MLC LLM a Web LLM je teraz možné nasadiť akékoľvek jazykový model podľa výberu na akomkoľvek zariadení. Vedci z Carnegie Mellon oznámili, že by to otvorilo celý rad aplikácií, ktoré predtým neboli možné. akýkoľvek jazykový model teraz môžu byť nasadené na rôznych výpočtových zariadeniach, ako sú notebooky a telefóny, či dokonca procesory a video akcelerátory. To otvára svet možností pre spracovanie prirodzeného jazyka a strojové učenie.
Nová iniciatíva od Carnegie Mellon dláždi cestu pre celý rad nových aplikácií a použití na pochopenie prirodzeného jazyka. Keďže tieto jazykové modely môžete použiť na akomkoľvek zariadení, je oveľa jednoduchšie nasadiť takúto technológiu v mnohých rôznych scenároch. Či už ide o virtuálnych asistentov alebo automatizované služby zákazníkom, tento nový nástroj by mohol mať drastický vplyv na spôsob, akým sa tieto úlohy vykonávajú.
Výskumný tím Carnegie Mellon vyvinul MLC LLM, ktorý sa dá spustiť na akomkoľvek zariadení, vrátane iPhonov a iných inteligentných domácich zariadení, s moderným procesorom a 6 GB alebo viac RAM. Tento zjednodušený prístup znamená, že zariadenia teraz dokážu spúšťať jazykové modely s rýchlosťou generovania takmer v reálnom čase, aj keď sú optimalizované externými vývojármi a nie inžiniermi spoločnosti Apple.
Okrem toho, že umožňuje prirodzené interakcie s produktmi, MLC LLM možno použiť aj na optimalizáciu úloh správy zariadení. S iba 4 GB až 6 GB pamäte RAM potrebnej na spustenie bude tento revolučný jazykový model skvelým doplnkom k budúcim modelom iPhone a mohol by byť potenciálne uvedený do výroby bez zdĺhavého vývojový proces.
Zavedením MLC LLM jazykový modelVýskumníci z Carnegie Mellon vytvorili efektívny a robustný spôsob spúšťania jazykových modelov na akomkoľvek zariadení. Systém MLC LLM je prelomom v spracovaní prirodzeného jazyka a umožní používateľom prirodzenú interakciu s ich zariadeniami efektívnejšie. Má tiež potenciál výrazne urýchliť proces vývoja budúcich úloh správy zariadení. Možnosti sú nekonečné s MLC LLM a práca Carnegie Mellon určite bude zmeniť spôsob, akým uvažujeme o jazykových modeloch k lepšiemu.
Prečítajte si viac o AI:
Vylúčenie zodpovednosti
V súlade s Pokyny k projektu Trust, uvedomte si, že informácie uvedené na tejto stránke nie sú zamýšľané a nemali by byť interpretované ako právne, daňové, investičné, finančné alebo iné formy poradenstva. Je dôležité investovať len toľko, koľko si môžete dovoliť stratiť a v prípade akýchkoľvek pochybností vyhľadať nezávislé finančné poradenstvo. Ak chcete získať ďalšie informácie, odporúčame vám pozrieť si zmluvné podmienky, ako aj stránky pomoci a podpory poskytnuté vydavateľom alebo inzerentom. MetaversePost sa zaviazala poskytovať presné a nezaujaté správy, ale podmienky na trhu sa môžu zmeniť bez upozornenia.
O autorovi
Damir je vedúci tímu, produktový manažér a redaktor v Metaverse Post, pokrývajúce témy ako AI/ML, AGI, LLM, Metaverse a Web3- súvisiace oblasti. Jeho články priťahujú každý mesiac obrovské publikum s viac ako miliónom používateľov. Zdá sa, že je odborníkom s 10-ročnými skúsenosťami v oblasti SEO a digitálneho marketingu. Damir bol spomenutý v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a ďalšie publikácie. Ako digitálny nomád cestuje medzi SAE, Tureckom, Ruskom a SNŠ. Damir získal bakalársky titul z fyziky, o ktorom sa domnieva, že mu dal schopnosti kritického myslenia potrebné na to, aby bol úspešný v neustále sa meniacom prostredí internetu.
Ďalšie článkyDamir je vedúci tímu, produktový manažér a redaktor v Metaverse Post, pokrývajúce témy ako AI/ML, AGI, LLM, Metaverse a Web3- súvisiace oblasti. Jeho články priťahujú každý mesiac obrovské publikum s viac ako miliónom používateľov. Zdá sa, že je odborníkom s 10-ročnými skúsenosťami v oblasti SEO a digitálneho marketingu. Damir bol spomenutý v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a ďalšie publikácie. Ako digitálny nomád cestuje medzi SAE, Tureckom, Ruskom a SNŠ. Damir získal bakalársky titul z fyziky, o ktorom sa domnieva, že mu dal schopnosti kritického myslenia potrebné na to, aby bol úspešný v neustále sa meniacom prostredí internetu.