Decembris 19, 2023

Hugging Face izpilddirektors prognozē, ka 2024. gadā dominēs mazāki AI modeļi

Publicēts: 19. gada 2023. decembrī plkst. 7:10 Atjaunināts: 19. gada 2023. decembrī plkst. 8:52

Rediģēts un pārbaudīts ar faktiem: 19. gada 2023. decembris, plkst. 7:10

Īsumā

2024. gadā parādīsies mazo valodu modeļu popularizēšana, jo uzņēmumi virzīs efektivitātes, izmaksu lietderības un pieejamības robežas.

Hugging Face izpilddirektors prognozē, ka 2024. gadā dominēs mazāki AI modeļi

Par mākslīgais intelekts2024. gads ir gatavs iezīmēt nozīmīgu pagrieziena punktu — līdz ar mazo valodu modeļu (SLM) pieaugumu, uzņēmumiem virzoties uz efektivitātes, izmaksu lietderības un pieejamības robežām.

Ceļš no masveida lielo valodu modeļu (LLM) dominēšanas līdz kompaktu, jaudīgu SLM rašanās sola pārveidot AI ainava.

Šī prasība ir atradusi savu atbalsta formu Clam Delangue, uzņēmuma līdzdibinātājs un izpilddirektors Apskāviena seja.
“Microsoft AI Phi-2 tagad ir populārākais Hugging Face modelis. 2024. gads būs mazo AI modeļu gads! teica Delangue, a LinkedIn ziņa.

Turklāt decembra sākumā franču mākslīgā intelekta starta uzņēmums Mistral, drīz pēc tam, kad palielināja ievērojamu summu $ 415 miljoni finansēšanas kārtu, ieviesa Mixtral 8x7B — atvērtā koda SLM, kas ir ātri ieguvis vilces spēku, jo spēj konkurēt ar GPT-3.5, izmantojot noteiktus etalonus, vienlaikus darbojoties vienā datorā ar pieticīgu 100 gigabaitu operatīvo atmiņu.

Mistral pieeja, ko sauc par “rets ekspertu maisījuma” modelis, apvieno mazākus modeļus, kas apmācīti konkrētiem uzdevumiem, panākot ievērojamu efektivitāti.

Nedrīkst pārspēt, tehnoloģiju gigants microsoft arēnā ienāca ar Phi-2, tā pašmāju SLM jaunāko versiju. Īpaši mazs ar tikai 2.7 miljardiem parametru, Phi-2 ir paredzēts darbam mobilajā tālrunī, demonstrējot nozares apņemšanos samazināt modeļu izmērus, neapdraudot iespējas.

Modeļi kā GPT-3, kas lepojas ar satriecošiem 175 miljardiem parametru, demonstrēja spēju ģenerēt cilvēkiem līdzīgu tekstu, atbildēt uz jautājumiem un apkopot dokumentus. Tomēr LLM raksturīgās negatīvās puses, tostarp bažas par efektivitāti, izmaksām un pielāgojamību, ir pavērušas ceļu SLM uzplaukumam.

Faktori, kas veicina maza mēroga valodu modeļa izstrādi

SLM var lepoties ar racionalizētu pieeju ar mazākiem parametriem, kas nodrošina ātrāku secinājumu izdarīšanas ātrumu un lielāku caurlaidspēju. To samazinātās atmiņas un uzglabāšanas prasības padara skaitļošanas procesus elastīgus, izaicinot tradicionālo uzskatu, ka modeļa jaudai vienmēr jābūt paralēli datu apetītes pieaugumam.

Kamēr lielie valodu modeļi patīk GPT-3 rada pārmērīgas izmaksas — bieži vien desmitiem miljonu dolāru attīstībai — SLM ir rentabla alternatīva.

Šos modeļus var apmācīt, izvietot un darbināt ar viegli pieejamu preču aparatūru, padarot tos par finansiāli dzīvotspējīgu izvēli uzņēmumiem. Turklāt to pieticīgās resursu prasības pozicionē tos kā ideālus kandidātus malu skaitļošanas lietojumprogrammām, kas darbojas bezsaistē ierīcēs ar mazāku jaudu.

Tāpat galvenā SLM priekšrocība ir to pielāgojamība. Atšķirībā no lielākajiem partneriem, kas rada kompromisus starp domēniem, SLM var precīzi pielāgot noteiktām lietojumprogrammām. To ātrie iterācijas cikli atvieglo praktiskus eksperimentus, ļaujot izstrādātājiem pielāgot modeļus konkrētām vajadzībām.

Tuvojoties 2024. gadam, mazo valodu modeļu pieaugums liecina par mākslīgā intelekta transformācijas laikmetu. Posms ir paredzēts Mazo AI modeļu gadam, kurā inovācijas un pieejamība saplūst ar redefine mākslīgā intelekta iespējas.

Atbildības noraidīšana

Atbilstīgi Uzticības projekta vadlīnijas, lūdzu, ņemiet vērā, ka šajā lapā sniegtā informācija nav paredzēta un to nedrīkst interpretēt kā juridisku, nodokļu, ieguldījumu, finanšu vai jebkāda cita veida padomu. Ir svarīgi ieguldīt tikai to, ko varat atļauties zaudēt, un meklēt neatkarīgu finanšu padomu, ja jums ir šaubas. Lai iegūtu papildinformāciju, iesakām skatīt pakalpojumu sniegšanas noteikumus, kā arī palīdzības un atbalsta lapas, ko nodrošina izdevējs vai reklāmdevējs. MetaversePost ir apņēmies sniegt precīzus, objektīvus pārskatus, taču tirgus apstākļi var tikt mainīti bez iepriekšēja brīdinājuma.

Par Autors

Kumars ir pieredzējis tehnoloģiju žurnālists ar specializāciju AI/ML dinamiskos krustpunktos, mārketinga tehnoloģijās un tādās jaunās jomās kā kriptovalūta, blokķēde un NFTs. Ar vairāk nekā 3 gadu pieredzi šajā nozarē Kumar ir izveidojis pierādītus sasniegumus pārliecinošu stāstījumu veidošanā, ieskatu interviju vadīšanā un visaptverošu ieskatu sniegšanā. Kumar kompetence slēpjas augstas ietekmes satura, tostarp rakstu, ziņojumu un pētījumu publikāciju veidošanā ievērojamām nozares platformām. Ar unikālu prasmju kopumu, kas apvieno tehniskās zināšanas un stāstu stāstīšanu, Kumars izceļas ar sarežģītu tehnoloģisku koncepciju nodošanu dažādām auditorijām skaidrā un saistošā veidā.

Vairāk rakstus

Kumars Gandharvs