Nieuwsverslag Technologie
12 oktober 2023

De huidige grote taalmodellen zullen kleine modellen zijn, aldus een onderzoeker van OpenAI

Hyung Won Chung, een ervaren AI-onderzoeker die voorheen in dienst was bij Google Brain en momenteel lid is van de OpenAI team, hield een tot nadenken stemmende toespraak van 45 minuten waarin hij de wereld van grote taalmodellen in 2023 verkende. Chung heeft ervaring in het veld; hij was de eerste auteur van het Google-artikel “Schaalinstructie-verfijnde taalmodellen,waarin wordt onderzocht hoe grote taalmodellen kunnen worden getraind om instructies te volgen.

Hyung Won Chung, OpenAI

Chung benadrukt de wereld van uitgebreide taalmodellen als dynamisch. In de wereld van LLM's evolueert het leidende principe voortdurend, in tegenstelling tot traditionele vakgebieden waar fundamentele aannames doorgaans stabiel blijven. Met de komende generatie modellen kan wat momenteel als onmogelijk of onpraktisch wordt beschouwd mogelijk worden. Hij benadrukt het belang van het voorafgaan van de meeste beweringen over LLM-capaciteiten met “voorlopig”. Een model kan een taak uitvoeren; het is gewoon nog niet gelukt.

Grote modellen van nu zijn over een paar jaar kleine modellen

Hyung Won Chung, OpenAI

De behoefte aan nauwgezette documentatie en reproduceerbaarheid in AI-onderzoek is een van de belangrijkste lessen die we uit Chungs toespraak kunnen leren. Het is van cruciaal belang om lopende werkzaamheden grondig te documenteren naarmate het vakgebied zich ontwikkelt. Deze strategie garandeert dat experimenten snel kunnen worden gerepliceerd en opnieuw kunnen worden bekeken, waardoor onderzoekers kunnen voortbouwen op eerder werk. Door deze praktijk wordt erkend dat zich in de toekomst capaciteiten kunnen ontwikkelen die tijdens het eerste onderzoek niet praktisch waren.

Chung wijdt een deel van zijn lezing aan het ophelderen van de complexiteit van data en modelparallellisme. Voor degenen die geïnteresseerd zijn om dieper in te gaan op de technische aspecten van AI, biedt dit gedeelte waardevolle inzichten in de innerlijke werking van deze parallellismetechnieken. Het begrijpen van deze mechanismen is cruciaal voor het optimaliseren grootschalige modeltraining.

Chung stelt dat de huidige objectieve functie, Maximum Likelihood, die wordt gebruikt voor LLM-vooropleiding een knelpunt is als het gaat om het bereiken van werkelijk enorme schaalgroottes, zoals 10,000 maal de capaciteit van GPT-4. Naarmate machine learning vordert, worden handmatig ontworpen verliesfuncties steeds beperkender.

Chung suggereert dat het volgende paradigma in de ontwikkeling van AI het leren van functies via afzonderlijke algoritmen omvat. Deze benadering, hoewel nog in de kinderschoenen, houdt de belofte in van schaalbaarheid die verder gaat dan de huidige beperkingen. Hij benadrukt ook de lopende inspanningen, zoals Reinforcement Learning from Human Feedback (RLHF) met Rule Modeling, als stappen in deze richting, hoewel er nog uitdagingen moeten worden overwonnen.

Disclaimer

In lijn met de Richtlijnen voor vertrouwensprojectenHoud er rekening mee dat de informatie op deze pagina niet bedoeld is en niet mag worden geïnterpreteerd als juridisch, fiscaal, beleggings-, financieel of enige andere vorm van advies. Het is belangrijk om alleen te beleggen wat u zich kunt veroorloven te verliezen en onafhankelijk financieel advies in te winnen als u twijfels heeft. Voor meer informatie raden wij u aan de algemene voorwaarden en de hulp- en ondersteuningspagina's van de uitgever of adverteerder te raadplegen. MetaversePost streeft naar nauwkeurige, onpartijdige berichtgeving, maar de marktomstandigheden kunnen zonder voorafgaande kennisgeving worden gewijzigd.

Over de auteur

Damir is de teamleider, productmanager en redacteur bij Metaverse Post, met onderwerpen als AI/ML, AGI, LLM's, Metaverse en Web3-gerelateerde velden. Zijn artikelen trekken maandelijks een enorm publiek van meer dan een miljoen gebruikers. Hij blijkt een expert te zijn met 10 jaar ervaring in SEO en digitale marketing. Damir is genoemd in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto en andere publicaties. Hij reist als digitale nomade tussen de VAE, Turkije, Rusland en het GOS. Damir behaalde een bachelordiploma in natuurkunde, wat hem volgens hem de kritische denkvaardigheden heeft gegeven die nodig zijn om succesvol te zijn in het steeds veranderende landschap van internet. 

Meer artikelen
Damir Jalalov
Damir Jalalov

Damir is de teamleider, productmanager en redacteur bij Metaverse Post, met onderwerpen als AI/ML, AGI, LLM's, Metaverse en Web3-gerelateerde velden. Zijn artikelen trekken maandelijks een enorm publiek van meer dan een miljoen gebruikers. Hij blijkt een expert te zijn met 10 jaar ervaring in SEO en digitale marketing. Damir is genoemd in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto en andere publicaties. Hij reist als digitale nomade tussen de VAE, Turkije, Rusland en het GOS. Damir behaalde een bachelordiploma in natuurkunde, wat hem volgens hem de kritische denkvaardigheden heeft gegeven die nodig zijn om succesvol te zijn in het steeds veranderende landschap van internet. 

Hot Stories
Schrijf je in op onze nieuwsbrief.
Laatste Nieuws

De institutionele belangstelling groeit richting Bitcoin ETF’s te midden van volatiliteit

Uit openbaarmakingen via 13F-registraties blijkt dat opmerkelijke institutionele beleggers zich bezighouden met Bitcoin ETF's, wat een groeiende acceptatie onderstreept van ...

Meer weten

De dag van de veroordeling breekt aan: het lot van CZ hangt in evenwicht terwijl de Amerikaanse rechtbank het pleidooi van DOJ in overweging neemt

Changpeng Zhao staat vandaag op het punt te worden veroordeeld door een Amerikaanse rechtbank in Seattle.

Meer weten
Sluit u aan bij onze innovatieve technologiegemeenschap
Lees meer
Lees meer
Nexo initieert 'The Hunt' om gebruikers te belonen met $12 miljoen aan NEXO-tokens voor betrokkenheid bij zijn ecosysteem
Markten Nieuwsverslag Technologie
Nexo initieert 'The Hunt' om gebruikers te belonen met $12 miljoen aan NEXO-tokens voor betrokkenheid bij zijn ecosysteem
8 mei 2024
Revolut's Revolut X Exchange verleidt cryptohandelaren met nulmakerkosten en geavanceerde analyses
Markten Software Verhalen en recensies Technologie
Revolut's Revolut X Exchange verleidt cryptohandelaren met nulmakerkosten en geavanceerde analyses
8 mei 2024
Crypto-handelsplatform BitMEX introduceert handel in opties zonder kosten en contante prikkels
Business Markten Nieuwsverslag
Crypto-handelsplatform BitMEX introduceert handel in opties zonder kosten en contante prikkels
8 mei 2024
Lisk stapt officieel over naar Ethereum Layer 2 en onthult Core v4.0.6
Nieuwsverslag Technologie
Lisk stapt officieel over naar Ethereum Layer 2 en onthult Core v4.0.6
8 mei 2024