Carnegie Mellonin tutkijat esittelevät MLC LLM:n kielimallien ajamiseen kaikilla laitteilla
Lyhyesti
MLC LLM ja Web LLM antavat käyttäjien ottaa käyttöön kielimalleja millä tahansa laitteella, mikä mahdollistaa uusia sovelluksia ja käyttötapoja luonnollisen kielen ymmärtämiseksi.
Carnegie Mellonin yliopiston tutkijat ovat esittäneet MLC LLM, joukko työkaluja, jotka voivat mullistaa kielimallien käytön millä tahansa laitteella. Tällaisten mallien avulla käyttäjät voivat luoda erilaisia luonnollisen kielen sovelluksia, kuten virtuaalisia avustajia ja älykkäitä chatbotteja. Erillisten suoritusoptimointien ansiosta MLC LLM:ää voidaan nyt käyttää eri alustoilla ja skenaarioissa.
Uusi työkalu, joka tunnetaan nimellä Web LLM, on myös osa tätä aloitetta. Se mahdollistaa kielimallien käynnistämisen suoraan selaimessa, mikä tarkoittaa, että käyttäjien ei tarvitse ladata manuaalisesti järjestelmää, jonka koko voi olla useita gigatavuja. Vicuna 7B -malli, jossa on 7 miljardia parametria, on luotu tällä tavalla. Tämä voi olla erittäin hyödyllistä suunniteltaessa paremmin sopivia virtuaalisia avustajia ja chatbotteja, koska ne vaativat suuria määriä parametreja.
MLC LLM:n ja Web LLM:n avulla on nyt mahdollista ottaa käyttöön mikä tahansa kielimalli valittavissa millä tahansa laitteella. Carnegie Mellonin tutkijat ovat raportoineet, että tämä avaisi joukon sovelluksia, jotka eivät olleet aiemmin mahdollisia. Minkä tahansa kielimalli voidaan nyt ottaa käyttöön erilaisissa tietokoneissa, kuten kannettavissa tietokoneissa ja puhelimissa, tai jopa prosessoreissa ja videokiihdyttimissä. Tämä avaa mahdollisuuksia luonnollisen kielen käsittelyyn ja koneoppiminen.
Carnegie Mellonin uusi aloite tasoittaa tietä useille uusille sovelluksille ja käytöille luonnollisen kielen ymmärtämiseen. Koska voit käyttää näitä kielimalleja missä tahansa laitteessa, on paljon helpompaa käyttää tällaista tekniikkaa monissa eri skenaarioissa. Olipa kyseessä virtuaaliassistentit tai automatisoitu asiakaspalvelu, tällä uudella työkalulla voi olla dramaattinen vaikutus näiden tehtävien suorittamiseen.
Carnegie Mellonin tutkimusryhmä kehitti MLC LLM:n käytettäväksi kaikissa laitteissa, mukaan lukien iPhonet ja muut älykodin laitteet, joissa on moderni prosessori ja 6 Gt tai enemmän RAM-muistia. Tämä virtaviivainen lähestymistapa tarkoittaa, että laitteet voivat nyt käyttää kielimalleja lähes reaaliaikaisella tuotantonopeudella, vaikka ne olisivat optimoineet ulkopuoliset kehittäjät eivätkä Applen insinöörit.
Sen lisäksi, että MLC LLM mahdollistaa luonnollisen vuorovaikutuksen tuotteiden kanssa, sitä voidaan käyttää myös laitehallintatehtävien optimointiin. Tämä vallankumouksellinen kielimalli täydentää erinomaisesti tulevia iPhone-malleja, sillä RAM-muistia tarvitaan vain 4–6 Gt, joten se voidaan mahdollisesti ottaa tuotantoon ilman pitkää aikaa kehitysprosessi.
Esittelemällä MLC LLM:n kielimalli, Carnegie Mellonin tutkijat ovat luoneet tehokkaan ja vankan tavan ajaa kielimalleja kaikilla laitteilla. MLC LLM -järjestelmä on läpimurto luonnollisen kielen käsittelyssä ja mahdollistaa käyttäjille ollakseen vuorovaikutuksessa luonnollisesti laitteidensa kanssa tehokkaammin. Sillä on myös potentiaalia merkittävästi nopeuttaa kehitysprosessia tulevia laitehallintatehtäviä varten. Mahdollisuudet ovat loputtomat MLC LLM:n kanssa, ja Carnegie Mellonin työ tekee varmasti muuttaa tapaamme ajatella kielimalleista paremmaksi.
Lue lisää tekoälystä:
Vastuun kieltäminen
Mukaisesti Luottamusprojektin ohjeetHuomaa, että tällä sivulla annettuja tietoja ei ole tarkoitettu eikä niitä tule tulkita oikeudellisiksi, verotukselliseksi, sijoitus-, rahoitus- tai minkään muun muodon neuvoiksi. On tärkeää sijoittaa vain sen verran, mitä sinulla on varaa menettää, ja pyytää riippumatonta talousneuvontaa, jos sinulla on epäilyksiä. Lisätietoja saat käyttöehdoista sekä myöntäjän tai mainostajan tarjoamista ohje- ja tukisivuista. MetaversePost on sitoutunut tarkkaan, puolueettomaan raportointiin, mutta markkinaolosuhteet voivat muuttua ilman erillistä ilmoitusta.
Author
Damir on tiimin johtaja, tuotepäällikkö ja toimittaja osoitteessa Metaverse Post, kattaa aiheita, kuten AI/ML, AGI, LLMs, Metaverse ja Web3- liittyvät kentät. Hänen artikkelinsa houkuttelevat yli miljoonan käyttäjän massiivisen yleisön joka kuukausi. Hän näyttää olevan asiantuntija, jolla on 10 vuoden kokemus hakukoneoptimoinnista ja digitaalisesta markkinoinnista. Damir on mainittu Mashablessa, Wiredissä, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muut julkaisut. Hän matkustaa Arabiemiirikuntien, Turkin, Venäjän ja IVY-maiden välillä digitaalisena nomadina. Damir suoritti kandidaatin tutkinnon fysiikasta, jonka hän uskoo antaneen hänelle kriittisen ajattelun taidot menestyäkseen jatkuvasti muuttuvassa internetin maisemassa.
lisää artikkeleitaDamir on tiimin johtaja, tuotepäällikkö ja toimittaja osoitteessa Metaverse Post, kattaa aiheita, kuten AI/ML, AGI, LLMs, Metaverse ja Web3- liittyvät kentät. Hänen artikkelinsa houkuttelevat yli miljoonan käyttäjän massiivisen yleisön joka kuukausi. Hän näyttää olevan asiantuntija, jolla on 10 vuoden kokemus hakukoneoptimoinnista ja digitaalisesta markkinoinnista. Damir on mainittu Mashablessa, Wiredissä, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muut julkaisut. Hän matkustaa Arabiemiirikuntien, Turkin, Venäjän ja IVY-maiden välillä digitaalisena nomadina. Damir suoritti kandidaatin tutkinnon fysiikasta, jonka hän uskoo antaneen hänelle kriittisen ajattelun taidot menestyäkseen jatkuvasti muuttuvassa internetin maisemassa.