Nieuwsverslag Technologie
19 december 2023

De CEO van Hugging Face voorspelt dat kleinere AI-modellen in 2024 zullen domineren

In het kort

In 2024 zullen kleine taalmodellen opkomen, omdat bedrijven de grenzen van efficiëntie, kosteneffectiviteit en toegankelijkheid verleggen.

De CEO van Hugging Face voorspelt dat kleinere AI-modellen in 2024 zullen domineren

Voor kunstmatige intelligentiestaat het jaar 2024 op het punt een belangrijk keerpunt te markeren – met de opkomst van kleine taalmodellen (SLM’s), nu bedrijven de grenzen van efficiëntie, kosteneffectiviteit en toegankelijkheid verleggen.

De reis van de dominantie van enorme grote taalmodellen (LLM’s) naar de opkomst van compacte, krachtige SLM’s belooft de wereld opnieuw vorm te geven. AI-landschap.

Deze claim heeft steun gekregen van Clam Delangue, mede-oprichter en CEO van Gezicht knuffelen.
“Phi-2 van Microsoft AI is nu het nummer één trending model op Hugging Face. 2024 wordt het jaar van kleine AI-modellen!” zei Delangue, in a LinkedIn bericht.

Bovendien haalde de Franse AI-startup Mistral begin december al snel een substantieel bedrag op $ 415 miljoen financieringsronde Mixtral 8x7B geïntroduceerd, een open-source SLM die snel terrein heeft gewonnen vanwege zijn vermogen om te wedijveren met de kwaliteit van GPT-3.5 op bepaalde benchmarks, en dat allemaal terwijl het op één computer draait met een bescheiden 100 gigabyte RAM.

De aanpak van Mistral, ook wel het ‘sparse mix of experts’-model genoemd, combineert kleinere modellen die zijn getraind voor specifieke taken, waardoor opmerkelijke efficiëntie wordt bereikt.

We moeten niet achterblijven, technologiegigant Microsoft betrad de arena met Phi-2, de nieuwste versie van zijn eigen SLM. Phi-2.7 is opmerkelijk klein, met slechts 2 miljard parameters, en is ontworpen om op een mobiele telefoon te draaien. Hiermee wordt de inzet van de industrie getoond om modellen te verkleinen zonder concessies te doen aan de mogelijkheden.

Modellen zoals GPT-3, met maar liefst 175 miljard parameters, demonstreerde de mogelijkheid om mensachtige tekst te genereren, vragen te beantwoorden en documenten samen te vatten. De inherente nadelen van LLM's, waaronder zorgen met betrekking tot efficiëntie, kosten en aanpasbaarheid, hebben echter de weg vrijgemaakt voor de opkomst van SLM's.

Factoren die de ontwikkeling van kleinschalige taalmodellen stimuleren

SLM's beschikken over een gestroomlijnde aanpak met minder parameters, wat resulteert in een snellere inferentiesnelheid en een hogere doorvoer. Hun verminderde geheugen- en opslagvereisten maken computationele processen wendbaar, waardoor de conventionele overtuiging wordt uitgedaagd dat modelcapaciteit altijd parallel moet lopen aan de groei van de databehoefte.

Terwijl grote taalmodellen leuk vinden GPT-3 Omdat zij exorbitante kosten met zich meebrengen – vaak in de tientallen miljoenen dollars voor ontwikkeling – vormen SLM's een kosteneffectief alternatief.

Deze modellen kunnen worden getraind, ingezet en gebruikt op direct verkrijgbare standaardhardware, waardoor ze een financieel haalbare keuze zijn voor bedrijven. Bovendien positioneren hun bescheiden middelenvereisten hen als ideale kandidaten voor toepassingen in edge computing, die offline draaien op apparaten met een lager vermogen.

Op dezelfde manier ligt een belangrijke kracht van SLM’s in hun aanpasbaarheid. In tegenstelling tot hun grotere tegenhangers, die compromissen tussen domeinen vertegenwoordigen, kunnen SLM's nauwkeurig worden afgestemd op specifieke toepassingen. Hun snelle iteratiecycli vergemakkelijken praktische experimenten, waardoor ontwikkelaars modellen aan specifieke behoeften kunnen aanpassen.

Nu we 2024 naderen, luidt de opkomst van kleine taalmodellen een transformerend tijdperk in kunstmatige intelligentie in. Het toneel is klaar voor het Jaar van de Kleine AI-modellen, waar innovatie en toegankelijkheid samenkomendefine de mogelijkheden van kunstmatige intelligentie.

Disclaimer

In lijn met de Richtlijnen voor vertrouwensprojectenHoud er rekening mee dat de informatie op deze pagina niet bedoeld is en niet mag worden geïnterpreteerd als juridisch, fiscaal, beleggings-, financieel of enige andere vorm van advies. Het is belangrijk om alleen te beleggen wat u zich kunt veroorloven te verliezen en onafhankelijk financieel advies in te winnen als u twijfels heeft. Voor meer informatie raden wij u aan de algemene voorwaarden en de hulp- en ondersteuningspagina's van de uitgever of adverteerder te raadplegen. MetaversePost streeft naar nauwkeurige, onpartijdige berichtgeving, maar de marktomstandigheden kunnen zonder voorafgaande kennisgeving worden gewijzigd.

Over de auteur

Kumar is een ervaren technologiejournalist met een specialisatie in de dynamische kruispunten van AI/ML, marketingtechnologie en opkomende velden zoals crypto, blockchain en NFTS. Met meer dan drie jaar ervaring in de branche heeft Kumar een bewezen staat van dienst opgebouwd in het opstellen van boeiende verhalen, het houden van inzichtelijke interviews en het leveren van uitgebreide inzichten. De expertise van Kumar ligt in het produceren van inhoud met een grote impact, waaronder artikelen, rapporten en onderzoekspublicaties voor vooraanstaande industriële platforms. Met een unieke reeks vaardigheden die technische kennis en verhalen vertellen combineert, blinkt Kumar uit in het op een duidelijke en boeiende manier communiceren van complexe technologische concepten aan een divers publiek.

Meer artikelen
Kumar Gandharv
Kumar Gandharv

Kumar is een ervaren technologiejournalist met een specialisatie in de dynamische kruispunten van AI/ML, marketingtechnologie en opkomende velden zoals crypto, blockchain en NFTS. Met meer dan drie jaar ervaring in de branche heeft Kumar een bewezen staat van dienst opgebouwd in het opstellen van boeiende verhalen, het houden van inzichtelijke interviews en het leveren van uitgebreide inzichten. De expertise van Kumar ligt in het produceren van inhoud met een grote impact, waaronder artikelen, rapporten en onderzoekspublicaties voor vooraanstaande industriële platforms. Met een unieke reeks vaardigheden die technische kennis en verhalen vertellen combineert, blinkt Kumar uit in het op een duidelijke en boeiende manier communiceren van complexe technologische concepten aan een divers publiek.

Van Ripple tot The Big Green DAO: hoe cryptocurrency-projecten bijdragen aan liefdadigheid

Laten we initiatieven onderzoeken die het potentieel van digitale valuta voor goede doelen benutten.

Meer weten

AlphaFold 3, Med-Gemini en anderen: de manier waarop AI de gezondheidszorg transformeert in 2024

AI manifesteert zich op verschillende manieren in de gezondheidszorg, van het blootleggen van nieuwe genetische correlaties tot het versterken van robotchirurgische systemen...

Meer weten
Sluit u aan bij onze innovatieve technologiegemeenschap
Lees meer
Lees meer
Vitalik Buterin brengt EIP-7706-voorstel uit om nieuw type gas te introduceren voor Ethereum-transacties
Nieuwsverslag Technologie
Vitalik Buterin brengt EIP-7706-voorstel uit om nieuw type gas te introduceren voor Ethereum-transacties
14 mei 2024
Worldcoin's WLD-token zal te maken krijgen met agressieve verkoopdruk met meer ontgrendelingen in de komende maanden, waarschuwt DeFi2 Bybit-handelaar
Markten Nieuwsverslag Technologie
Worldcoin's WLD-token zal te maken krijgen met agressieve verkoopdruk met meer ontgrendelingen in de komende maanden, waarschuwt DeFi2 Bybit-handelaar
14 mei 2024
Crypto Exchange Coinbase ervaart systeemstoring, gebruikersfondsen veilig Wile Company onderzoekt probleem
Markten Nieuwsverslag Technologie
Crypto Exchange Coinbase ervaart systeemstoring, gebruikersfondsen veilig Wile Company onderzoekt probleem
14 mei 2024
Van Ripple tot The Big Green DAO: hoe cryptocurrency-projecten bijdragen aan liefdadigheid
Analyse crypto Wiki Business Onderwijs Lifestyle Markten Software Technologie
Van Ripple tot The Big Green DAO: hoe cryptocurrency-projecten bijdragen aan liefdadigheid
13 mei 2024