Novice Tehnologija
December 19, 2023

Generalni direktor podjetja Hugging Face napoveduje, da bodo leta 2024 prevladovali manjši modeli umetne inteligence

Na kratko

Leta 2024 bomo priča vzponu malih jezikovnih modelov, saj bodo podjetja premikala meje učinkovitosti, stroškovne učinkovitosti in dostopnosti.

Generalni direktor podjetja Hugging Face napoveduje, da bodo leta 2024 prevladovali manjši modeli umetne inteligence

za Umetna inteligenca, je leto 2024 pripravljeno na pomembno prelomnico – z vzponom malih jezikovnih modelov (SLM), saj podjetja premikajo meje učinkovitosti, stroškovne učinkovitosti in dostopnosti.

Potovanje od prevlade masivnih velikih jezikovnih modelov (LLM) do nastanka kompaktnih, močnih SLM-jev obljublja preoblikovanje AI pokrajina.

Ta trditev je podprla Clama Delangueja, soustanovitelja in izvršnega direktorja Objemni obraz.
»Phi-2 podjetja Microsoft AI je zdaj najbolj priljubljen model na Hugging Face. Leto 2024 bo leto majhnih modelov AI!« je dejal Delangue, v a Objava LinkedIn.

Poleg tega je v začetku decembra francoski zagon AI Mistral kmalu zatem zbral precejšnjo vrednost $ 415 milijonov krogu financiranja, je predstavil Mixtral 8x7B, odprtokodni SLM, ki je hitro pridobil oprijem zaradi svoje sposobnosti, da se kosa s kakovostjo GPT-3.5 na določenih merilih uspešnosti, vse med delovanjem na enem samem računalniku s skromnimi 100 gigabajti RAM-a.

Mistralov pristop, imenovan model 'redke mešanice strokovnjakov', združuje manjše modele, usposobljene za posebne naloge, s čimer dosega izjemno učinkovitost.

Da ne zaostajaš, tehnološki velikan Microsoft vstopil v areno s Phi-2, najnovejšo različico domačega SLM. Predvsem majhen s samo 2.7 milijardami parametrov je Phi-2 zasnovan za delovanje na mobilnem telefonu in prikazuje zavezanost industrije zmanjševanju modelov brez ogrožanja zmogljivosti.

Modeli kot GPT-3, ki se ponaša z osupljivimi 175 milijardami parametrov, je predstavil zmožnost generiranja besedila, podobnega človeku, odgovarjanja na vprašanja in povzemanja dokumentov. Vendar pa so inherentne slabosti LLM-jev, vključno s pomisleki glede učinkovitosti, stroškov in prilagodljivosti, tlakovale pot za vzpon SLM-jev.

Dejavniki, ki spodbujajo razvoj jezikovnega modela majhnega obsega

SLM-ji se ponašajo z racionaliziranim pristopom z manj parametri, kar ima za posledico večjo hitrost sklepanja in večjo prepustnost. Njihove zmanjšane zahteve po pomnilniku in shranjevanju naredijo računalniške procese prožne, kar izpodbija konvencionalno prepričanje, da mora zmogljivost modela vedno vzporedno rasti apetita po podatkih.

Medtem ko so veliki jezikovni modeli podobni GPT-3 povzročijo pretirane stroške – pogosto v desetine milijonov dolarjev za razvoj – SLM predstavljajo stroškovno učinkovito alternativo.

Te modele je mogoče usposobiti, namestiti in upravljati na takoj dostopni osnovni strojni opremi, zaradi česar so finančno sprejemljiva izbira za podjetja. Poleg tega so zaradi skromnih zahtev po virih idealni kandidati za aplikacije v robnem računalništvu, ki delujejo brez povezave na napravah z manjšo porabo energije.

Podobno je ključna prednost SLM-jev njihova prilagodljivost. Za razliko od svojih večjih sorodnikov, ki predstavljajo kompromise med domenami, je SLM mogoče natančno nastaviti za specifične aplikacije. Njihovi hitri iteracijski cikli olajšajo praktično eksperimentiranje in razvijalcem omogočajo prilagajanje modelov posebnim potrebam.

Ko se bližamo letu 2024, vzpon majhnih jezikovnih modelov nakazuje transformativno dobo umetne inteligence. Oder je pripravljen za leto malih modelov umetne inteligence, kjer se inovacije in dostopnost združijo z redefine možnosti umetne inteligence.

Zavrnitev odgovornosti

V skladu z Smernice projekta Trust, upoštevajte, da informacije na tej strani niso namenjene in se jih ne sme razlagati kot pravni, davčni, naložbeni, finančni ali kakršen koli drug nasvet. Pomembno je, da vlagate samo tisto, kar si lahko privoščite izgubiti, in da poiščete neodvisen finančni nasvet, če imate kakršne koli dvome. Za dodatne informacije predlagamo, da si ogledate določila in pogoje ter strani s pomočjo in podporo, ki jih nudi izdajatelj ali oglaševalec. MetaversePost se zavzema za natančno in nepristransko poročanje, vendar se tržni pogoji lahko spremenijo brez predhodnega obvestila.

O avtorju

Kumar je izkušen tehnični novinar, specializiran za dinamična presečišča AI/ML, marketinške tehnologije in nastajajočih področij, kot so kripto, blockchain in NFTs. Z več kot 3 leti izkušenj v panogi je Kumar pridobil dokazane rezultate pri oblikovanju privlačnih pripovedi, vodenju pronicljivih intervjujev in zagotavljanju celovitih vpogledov. Kumarjevo strokovno znanje je v izdelavi odmevnih vsebin, vključno s članki, poročili in raziskovalnimi publikacijami za pomembne industrijske platforme. Z edinstvenim naborom spretnosti, ki združuje tehnično znanje in pripovedovanje zgodb, se Kumar odlikuje pri sporočanju zapletenih tehnoloških konceptov različnim občinstvom na jasen in privlačen način.

več člankov
Kumar Gandharv
Kumar Gandharv

Kumar je izkušen tehnični novinar, specializiran za dinamična presečišča AI/ML, marketinške tehnologije in nastajajočih področij, kot so kripto, blockchain in NFTs. Z več kot 3 leti izkušenj v panogi je Kumar pridobil dokazane rezultate pri oblikovanju privlačnih pripovedi, vodenju pronicljivih intervjujev in zagotavljanju celovitih vpogledov. Kumarjevo strokovno znanje je v izdelavi odmevnih vsebin, vključno s članki, poročili in raziskovalnimi publikacijami za pomembne industrijske platforme. Z edinstvenim naborom spretnosti, ki združuje tehnično znanje in pripovedovanje zgodb, se Kumar odlikuje pri sporočanju zapletenih tehnoloških konceptov različnim občinstvom na jasen in privlačen način.

Od valovanja do velikega zelenega DAO: Kako projekti kriptovalut prispevajo k dobrodelnosti

Raziščimo pobude, ki izkoriščajo potencial digitalnih valut za dobrodelne namene.

Več o tem

AlphaFold 3, Med-Gemini in drugi: način, kako umetna inteligenca spremeni zdravstveno varstvo leta 2024

Umetna inteligenca se v zdravstvu kaže na različne načine, od odkrivanja novih genetskih povezav do opolnomočenja robotskih kirurških sistemov ...

Več o tem
Pridružite se naši inovativni tehnološki skupnosti
Preberi več
Preberi več
Vitalik Buterin objavlja predlog EIP-7706 za uvedbo nove vrste plina za transakcije Ethereum Calldata
Novice Tehnologija
Vitalik Buterin objavlja predlog EIP-7706 za uvedbo nove vrste plina za transakcije Ethereum Calldata
Maj 14, 2024
Worldcoinov žeton WLD se bo soočil z agresivnim pritiskom prodaje z več odklepanji v prihodnjih mesecih, opozarja DeFi2 Bybit Trader
Prisotnost Novice Tehnologija
Worldcoinov žeton WLD se bo soočil z agresivnim pritiskom prodaje z več odklepanji v prihodnjih mesecih, opozarja DeFi2 Bybit Trader
Maj 14, 2024
Crypto Exchange Coinbase se sooča s sistemsko napako, skladi uporabnikov Secure Wile Company preiskuje težavo
Prisotnost Novice Tehnologija
Crypto Exchange Coinbase se sooča s sistemsko napako, skladi uporabnikov Secure Wile Company preiskuje težavo
Maj 14, 2024
Od valovanja do velikega zelenega DAO: Kako projekti kriptovalut prispevajo k dobrodelnosti
Analiza Crypto Wiki ŽELITE POSTATI PARTNER Izobraževanje Življenjski slog Prisotnost Software Tehnologija
Od valovanja do velikega zelenega DAO: Kako projekti kriptovalut prispevajo k dobrodelnosti
Maj 13, 2024
CRYPTOMERIA LABS PTE. LTD.