De CEO van Hugging Face voorspelt dat kleinere AI-modellen in 2024 zullen domineren
In het kort
In 2024 zullen kleine taalmodellen opkomen, omdat bedrijven de grenzen van efficiëntie, kosteneffectiviteit en toegankelijkheid verleggen.
Voor kunstmatige intelligentiestaat het jaar 2024 op het punt een belangrijk keerpunt te markeren – met de opkomst van kleine taalmodellen (SLM’s), nu bedrijven de grenzen van efficiëntie, kosteneffectiviteit en toegankelijkheid verleggen.
De reis van de dominantie van enorme grote taalmodellen (LLM’s) naar de opkomst van compacte, krachtige SLM’s belooft de wereld opnieuw vorm te geven. AI-landschap.
Deze claim heeft steun gekregen van Clam Delangue, mede-oprichter en CEO van Gezicht knuffelen.
“Phi-2 van Microsoft AI is nu het nummer één trending model op Hugging Face. 2024 wordt het jaar van kleine AI-modellen!” zei Delangue, in a LinkedIn bericht.
Bovendien haalde de Franse AI-startup Mistral begin december al snel een substantieel bedrag op $ 415 miljoen financieringsronde Mixtral 8x7B geïntroduceerd, een open-source SLM die snel terrein heeft gewonnen vanwege zijn vermogen om te wedijveren met de kwaliteit van GPT-3.5 op bepaalde benchmarks, en dat allemaal terwijl het op één computer draait met een bescheiden 100 gigabyte RAM.
De aanpak van Mistral, ook wel het ‘sparse mix of experts’-model genoemd, combineert kleinere modellen die zijn getraind voor specifieke taken, waardoor opmerkelijke efficiëntie wordt bereikt.
We moeten niet achterblijven, technologiegigant Microsoft betrad de arena met Phi-2, de nieuwste versie van zijn eigen SLM. Phi-2.7 is opmerkelijk klein, met slechts 2 miljard parameters, en is ontworpen om op een mobiele telefoon te draaien. Hiermee wordt de inzet van de industrie getoond om modellen te verkleinen zonder concessies te doen aan de mogelijkheden.
Modellen zoals GPT-3, met maar liefst 175 miljard parameters, demonstreerde de mogelijkheid om mensachtige tekst te genereren, vragen te beantwoorden en documenten samen te vatten. De inherente nadelen van LLM's, waaronder zorgen met betrekking tot efficiëntie, kosten en aanpasbaarheid, hebben echter de weg vrijgemaakt voor de opkomst van SLM's.
Factoren die de ontwikkeling van kleinschalige taalmodellen stimuleren
SLM's beschikken over een gestroomlijnde aanpak met minder parameters, wat resulteert in een snellere inferentiesnelheid en een hogere doorvoer. Hun verminderde geheugen- en opslagvereisten maken computationele processen wendbaar, waardoor de conventionele overtuiging wordt uitgedaagd dat modelcapaciteit altijd parallel moet lopen aan de groei van de databehoefte.
Terwijl grote taalmodellen leuk vinden GPT-3 Omdat zij exorbitante kosten met zich meebrengen – vaak in de tientallen miljoenen dollars voor ontwikkeling – vormen SLM's een kosteneffectief alternatief.
Deze modellen kunnen worden getraind, ingezet en gebruikt op direct verkrijgbare standaardhardware, waardoor ze een financieel haalbare keuze zijn voor bedrijven. Bovendien positioneren hun bescheiden middelenvereisten hen als ideale kandidaten voor toepassingen in edge computing, die offline draaien op apparaten met een lager vermogen.
Op dezelfde manier ligt een belangrijke kracht van SLM’s in hun aanpasbaarheid. In tegenstelling tot hun grotere tegenhangers, die compromissen tussen domeinen vertegenwoordigen, kunnen SLM's nauwkeurig worden afgestemd op specifieke toepassingen. Hun snelle iteratiecycli vergemakkelijken praktische experimenten, waardoor ontwikkelaars modellen aan specifieke behoeften kunnen aanpassen.
Nu we 2024 naderen, luidt de opkomst van kleine taalmodellen een transformerend tijdperk in kunstmatige intelligentie in. Het toneel is klaar voor het Jaar van de Kleine AI-modellen, waar innovatie en toegankelijkheid samenkomendefine de mogelijkheden van kunstmatige intelligentie.
Disclaimer
In lijn met de Richtlijnen voor vertrouwensprojectenHoud er rekening mee dat de informatie op deze pagina niet bedoeld is en niet mag worden geïnterpreteerd als juridisch, fiscaal, beleggings-, financieel of enige andere vorm van advies. Het is belangrijk om alleen te beleggen wat u zich kunt veroorloven te verliezen en onafhankelijk financieel advies in te winnen als u twijfels heeft. Voor meer informatie raden wij u aan de algemene voorwaarden en de hulp- en ondersteuningspagina's van de uitgever of adverteerder te raadplegen. MetaversePost streeft naar nauwkeurige, onpartijdige berichtgeving, maar de marktomstandigheden kunnen zonder voorafgaande kennisgeving worden gewijzigd.
Over de auteur
Kumar is een ervaren technologiejournalist met een specialisatie in de dynamische kruispunten van AI/ML, marketingtechnologie en opkomende velden zoals crypto, blockchain en NFTS. Met meer dan drie jaar ervaring in de branche heeft Kumar een bewezen staat van dienst opgebouwd in het opstellen van boeiende verhalen, het houden van inzichtelijke interviews en het leveren van uitgebreide inzichten. De expertise van Kumar ligt in het produceren van inhoud met een grote impact, waaronder artikelen, rapporten en onderzoekspublicaties voor vooraanstaande industriële platforms. Met een unieke reeks vaardigheden die technische kennis en verhalen vertellen combineert, blinkt Kumar uit in het op een duidelijke en boeiende manier communiceren van complexe technologische concepten aan een divers publiek.
Meer artikelenKumar is een ervaren technologiejournalist met een specialisatie in de dynamische kruispunten van AI/ML, marketingtechnologie en opkomende velden zoals crypto, blockchain en NFTS. Met meer dan drie jaar ervaring in de branche heeft Kumar een bewezen staat van dienst opgebouwd in het opstellen van boeiende verhalen, het houden van inzichtelijke interviews en het leveren van uitgebreide inzichten. De expertise van Kumar ligt in het produceren van inhoud met een grote impact, waaronder artikelen, rapporten en onderzoekspublicaties voor vooraanstaande industriële platforms. Met een unieke reeks vaardigheden die technische kennis en verhalen vertellen combineert, blinkt Kumar uit in het op een duidelijke en boeiende manier communiceren van complexe technologische concepten aan een divers publiek.