Nieuwsverslag Technologie
05 april 2023

8 dingen die u moet weten over grote taalmodellen

In het kort

Grote taalmodellen (LLM's) worden gebruikt om de nuances van natuurlijke taal te onderzoeken, het vermogen van machines om tekst te begrijpen en te genereren te verbeteren, en taken zoals stemherkenning en automatische vertaling te automatiseren.

Er is geen gemakkelijke oplossing voor het beheer van LLM's, maar ze zijn net zo capabel als mensen.

Met een toename van de ontwikkeling van natuurlijke taalverwerking en het gebruik ervan in het bedrijfsleven, is er een groeiende belangstelling voor grote taalmodellen. Deze modellen worden gebruikt om de nuances van natuurlijke taal te onderzoeken, het vermogen van machines om tekst te begrijpen en te genereren te verbeteren en taken zoals spraakherkenning en machinevertaling te automatiseren. Hier zijn acht essentiële dingen die u moet weten over grote taalmodellen (LLM).

10 dingen die u moet weten over grote taalmodellen
@Midjourney / Taka#4076

LLM's zijn meer "capabel" naarmate de kosten blijven stijgen

LLM's worden voorspelbaar "capabeler" met stijgende kosten, zelfs zonder coole innovaties. Het belangrijkste hier is voorspelbaarheid, die werd getoond in het artikel over GPT-4: vijf tot zeven kleine modellen werden aangeleerd met een budget van 0.1% van het laatste, en op basis daarvan werd een voorspelling gedaan voor een enorm model. Voor een algemene beoordeling van verbijstering en statistieken op een substeekproef van één specifieke taak, was een dergelijke voorspelling zeer nauwkeurig. Deze voorspelbaarheid is belangrijk voor bedrijven en organisaties die voor hun activiteiten afhankelijk zijn van LLM's, omdat ze dienovereenkomstig kunnen budgetteren en toekomstige uitgaven kunnen plannen. Het is echter belangrijk op te merken dat hoewel stijgende kosten kunnen leiden tot verbeterde mogelijkheden, het tempo van verbetering uiteindelijk kan stagneren, waardoor het nodig is om in nieuwe innovaties te investeren om vooruitgang te blijven boeken.

Een korte blik op hoe GPT modellen passen zich aan naarmate de opleidingskosten stijgen

Specifieke belangrijke vaardigheden komen echter vaak onvoorspelbaar naar voren als een bijproduct van toename opleidingskosten (langere training, meer gegevens, groter model) — het is bijna onmogelijk te voorspellen wanneer modellen bepaalde taken gaan uitvoeren. We gingen dieper in op het onderwerp in onze dit artikel over de geschiedenis van de ontwikkeling van GPT modellen. De afbeelding toont de verdeling van de toename in de kwaliteit van modellen over verschillende taken. Alleen de grote modellen kunnen verschillende taken leren uitvoeren. Deze grafiek benadrukt de aanzienlijke impact van het opschalen van de omvang van GPT modellen op hun prestaties bij verschillende taken. Het is echter belangrijk op te merken dat dit ten koste gaat van meer rekenkracht en milieu-impact.

Een korte blik op hoe GPT modellen passen zich aan naarmate de opleidingskosten stijgen

LLM's leren bordspellen te spelen door representaties van de buitenwereld te gebruiken

LLM's leren en gebruiken vaak representaties van de buitenwereld. Er zijn hier veel voorbeelden, en hier is er een van: Modellen getraind om bordspellen te spelen op basis van beschrijvingen van individuele zetten, zonder ooit een afbeelding van het speelveld te zien, leer interne representaties van de toestand van het bord bij elke zet. Deze interne representaties kunnen vervolgens worden gebruikt toekomst voorspellen bewegingen en uitkomsten, waardoor het model het spel op een hoog niveau kan spelen. Dit vermogen om representaties te leren en te gebruiken is een sleutel aspect van machine learning en kunstmatige intelligentie.

Er is geen gemakkelijke oplossing voor het beheer van LLM

Er zijn geen betrouwbare methoden om LLM-gedrag te controleren. Hoewel er enige vooruitgang is geboekt bij het begrijpen en verminderen van verschillende problemen (waaronder ChatGPT en GPT-4 met behulp van feedback) bestaat er geen consensus over de vraag of we deze kunnen oplossen. Er bestaat toenemende bezorgdheid dat dit in de toekomst een enorm, potentieel catastrofaal probleem zal worden als er nog grotere systemen worden gecreëerd. Daarom onderzoeken onderzoekers nieuwe methoden om ervoor te zorgen dat AI-systemen aansluiten bij menselijke waarden en doelen, zoals waardeafstemming en beloningstechniek. Het blijft echter een uitdagende taak om de veiligheid en betrouwbaarheid van LLM's in complexe scenario's uit de echte wereld.

Lees verder: OpenAI Stelt een team van meer dan 50 experts samen om te verbeteren GPT-4's Veiligheid

Experts hebben moeite om uit te leggen hoe de LLM werkt

Experts kunnen de innerlijke werking van de LLM nog niet interpreteren. Geen enkele techniek zou ons in staat stellen om op een bevredigende manier aan te geven welke soorten kennis, redeneringen of doelen het model gebruikt wanneer het enig resultaat genereert. Dit gebrek aan interpreteerbaarheid geeft aanleiding tot bezorgdheid over de betrouwbaarheid en eerlijkheid van de beslissingen van de LLM, vooral bij toepassingen met een hoge inzet, zoals strafrecht of kredietscores. Het benadrukt ook de noodzaak van verder onderzoek naar de ontwikkeling van meer transparante en verantwoordingsplichtige AI-modellen.

LLM's zijn net zo capabel als mensen

Hoewel LLM's in de eerste plaats zijn opgeleid om menselijk gedrag imiteren bij het schrijven van tekst, hebben ze het potentieel om ons in veel taken te overtreffen. Dit is al te zien bij het schaken of Go. Dit komt door hun vermogen om enorme hoeveelheden gegevens te analyseren en op basis van die analyse beslissingen te nemen met een snelheid die mensen niet kunnen evenaren. LLM's missen echter nog steeds de creativiteit en intuïtie die mensen bezitten, waardoor ze voor veel taken minder geschikt zijn.

Lees verder: OpenAI Stelt een team van meer dan 50 experts samen om te verbeteren GPT-4's Veiligheid

LLM's moeten meer zijn dan alleen "manusje-van-alles"

LLM's mogen niet de waarden uitdrukken van hun makers of de waarden die zijn gecodeerd in een selectie van internet. Ze mogen geen stereotypen of complottheorieën herhalen of proberen iemand te beledigen. In plaats daarvan moeten LLM's worden ontworpen om onbevooroordeelde en feitelijke informatie aan hun gebruikers te verstrekken, terwijl culturele en maatschappelijke verschillen worden gerespecteerd. Bovendien moeten ze regelmatig worden getest en gecontroleerd om ervoor te zorgen dat ze aan deze normen blijven voldoen.

Modellen zijn 'slimmer' dan mensen op basis van eerste indrukken denken

Schattingen van het vermogen van een model op basis van eerste indrukken zijn vaak misleidend. Heel vaak moet je met de juiste prompt komen, een model voorstellen en misschien voorbeelden laten zien, en het zal veel beter gaan werken. Dat wil zeggen, het is "slimmer" dan het op het eerste gezicht lijkt. Daarom is het cruciaal om het model een eerlijke kans te geven en het de nodige middelen te geven om optimaal te presteren. Met de juiste aanpak kunnen zelfs ogenschijnlijk ontoereikende modellen ons verrassen met hun mogelijkheden.

Als we ons concentreren op een steekproef van 202 taken uit de BIG-Bench-dataset (deze werd speciaal moeilijk gemaakt om te testen taalmodellen van en naar), dan laten de modellen in de regel (gemiddeld) een toename in kwaliteit zien met toenemende schaal, maar individueel kunnen de metrieken in taken:

  • geleidelijk verbeteren,
  • drastisch verbeteren,
  • blijft onveranderd,
  • kleiner worden,
  • tonen geen verband.

Dit alles leidt tot de onmogelijkheid om met vertrouwen de prestaties van een toekomstig systeem te extrapoleren. Vooral het groene gedeelte is interessant - dit is precies waar de kwaliteitsindicatoren zonder enige reden scherp omhoog schieten.

Lees meer over AI:

Disclaimer

In lijn met de Richtlijnen voor vertrouwensprojectenHoud er rekening mee dat de informatie op deze pagina niet bedoeld is en niet mag worden geïnterpreteerd als juridisch, fiscaal, beleggings-, financieel of enige andere vorm van advies. Het is belangrijk om alleen te beleggen wat u zich kunt veroorloven te verliezen en onafhankelijk financieel advies in te winnen als u twijfels heeft. Voor meer informatie raden wij u aan de algemene voorwaarden en de hulp- en ondersteuningspagina's van de uitgever of adverteerder te raadplegen. MetaversePost streeft naar nauwkeurige, onpartijdige berichtgeving, maar de marktomstandigheden kunnen zonder voorafgaande kennisgeving worden gewijzigd.

Over de auteur

Damir is de teamleider, productmanager en redacteur bij Metaverse Post, met onderwerpen als AI/ML, AGI, LLM's, Metaverse en Web3-gerelateerde velden. Zijn artikelen trekken maandelijks een enorm publiek van meer dan een miljoen gebruikers. Hij blijkt een expert te zijn met 10 jaar ervaring in SEO en digitale marketing. Damir is genoemd in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto en andere publicaties. Hij reist als digitale nomade tussen de VAE, Turkije, Rusland en het GOS. Damir behaalde een bachelordiploma in natuurkunde, wat hem volgens hem de kritische denkvaardigheden heeft gegeven die nodig zijn om succesvol te zijn in het steeds veranderende landschap van internet. 

Meer artikelen
Damir Jalalov
Damir Jalalov

Damir is de teamleider, productmanager en redacteur bij Metaverse Post, met onderwerpen als AI/ML, AGI, LLM's, Metaverse en Web3-gerelateerde velden. Zijn artikelen trekken maandelijks een enorm publiek van meer dan een miljoen gebruikers. Hij blijkt een expert te zijn met 10 jaar ervaring in SEO en digitale marketing. Damir is genoemd in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto en andere publicaties. Hij reist als digitale nomade tussen de VAE, Turkije, Rusland en het GOS. Damir behaalde een bachelordiploma in natuurkunde, wat hem volgens hem de kritische denkvaardigheden heeft gegeven die nodig zijn om succesvol te zijn in het steeds veranderende landschap van internet. 

De institutionele belangstelling groeit richting Bitcoin ETF’s te midden van volatiliteit

Uit openbaarmakingen via 13F-registraties blijkt dat opmerkelijke institutionele beleggers zich bezighouden met Bitcoin ETF's, wat een groeiende acceptatie onderstreept van ...

Meer weten

De dag van de veroordeling breekt aan: het lot van CZ hangt in evenwicht terwijl de Amerikaanse rechtbank het pleidooi van DOJ in overweging neemt

Changpeng Zhao staat vandaag op het punt te worden veroordeeld door een Amerikaanse rechtbank in Seattle.

Meer weten
Sluit u aan bij onze innovatieve technologiegemeenschap
Lees meer
Lees meer
Morph introduceert zijn Holesky-testnet met optimistische zkEVM-integratie, brugmechanisme en gedecentraliseerde sequencernetwerkfuncties
Nieuwsverslag Technologie
Morph introduceert zijn Holesky-testnet met optimistische zkEVM-integratie, brugmechanisme en gedecentraliseerde sequencernetwerkfuncties
6 mei 2024
Robinhood Crypto ontvangt Wells-kennisgeving van de effecten- en beurscommissie wegens vermeende schendingen van effecten
Markten Nieuwsverslag Technologie
Robinhood Crypto ontvangt Wells-kennisgeving van de effecten- en beurscommissie wegens vermeende schendingen van effecten
6 mei 2024
QuickSwap wordt geïmplementeerd op X Layer Mainnet en breidt het Polygon CDK-netwerk uit met Citadel Launch
Nieuwsverslag Technologie
QuickSwap wordt geïmplementeerd op X Layer Mainnet en breidt het Polygon CDK-netwerk uit met Citadel Launch 
6 mei 2024
Laag 2-netwerk Linea initieert het ZERO-tokenclaimen van ZeroLend Airdrop Gebruikers en investeerders
Markten Nieuwsverslag Technologie
Laag 2-netwerk Linea initieert het ZERO-tokenclaimen van ZeroLend Airdrop Gebruikers en investeerders
6 mei 2024