Nieuwsverslag Technologie
20 June 2023

AlphaZero van DeepMind leert efficiënte sorteeralgoritmen bij optimalisatie van neurale netwerken

In het kort

AlphaZero van DeepMind leert efficiënte sorteeralgoritmen door een sorteerspel te spelen met behulp van leertechnieken voor versterking.

DeepMind heeft opnieuw een vooruitgang geboekt op het gebied van machine learning. In navolging van hun succes bij het gebruik van Reinforcement Learning (RL) om AlphaZero efficiënter te onderwijzen algoritmen voor matrixvermenigvuldiging, hebben ze nu hun aandacht op gericht sorteeralgoritmen, met veelbelovende resultaten.

AlphaZero van DeepMind leert efficiënte sorteeralgoritmen bij optimalisatie van neurale netwerken
deepmind. com

Sorteren is een fundamentele bewerking die in tal van computerprogramma's wordt gebruikt. De efficiëntie van het sorteren van arrays, het uitvoeren van de taak in zo min mogelijk bewerkingen, is van groot belang. Traditioneel hebben onderzoekers verschillende efficiënte sorteeralgoritmen bedacht voor verschillende scenario's op basis van arraygroottes en gegevenskenmerken. DeepMind besloot echter een nieuwe aanpak te verkennen: a neuraal netwerk om dit probleem op te lossen.

Om dit te bereiken, introduceerde DeepMind de taak van het sorteren van een array als een spel voor AlphaZero. Door middel van RL-technieken hebben ze AlphaZero getraind om dit sorteerspel te spelen. Het resulterende model, bekend als AlphaDev, toonde opmerkelijke mogelijkheden voor het leren van efficiënte sorteeralgoritmen.

Het sorteerspel werkt door de toestand van de omgeving weer te geven als een paar, waarbij P staat voor het huidige sorteeralgoritme dat in assembleertaal is gegenereerd, en Z staat voor de toestand van het geheugen en de registers. Bij elke tijdstap neemt de AlphaZero-agent de huidige status als invoer en voert een actie uit, waarbij een nieuwe instructie aan het assembler-taalalgoritme wordt toegevoegd, zoals mov.

Stap voor stap bouwt AlphaZero het uiteindelijke sorteeralgoritme op in assembleertaal. De beloning van het model bij elke stap wordt bepaald door twee factoren: de juistheid van het verkregen algoritme en de latentie ervan. Correctheid wordt beoordeeld op basis van predefinieuwe invoer-uitvoerparen, waarbij de invoer een ongesorteerde array vertegenwoordigt en de uitvoer dezelfde array vertegenwoordigt, maar dan gesorteerd.

Het proces van het genereren van het sorteeralgoritme duurt een vooraf bepaald aantal stappen. Als er binnen dit tijdsbestek geen definitief werkend algoritme wordt verkregen, begint het generatieproces opnieuw.

Het getrainde model was belast met het produceren van sorteeralgoritmen voor reeksen van lengte 3, 4 en 5. Het is vermeldenswaard dat er twee soorten sorteeralgoritmen zijn: vaste sortering, die arrays van een specifieke lengte sorteert, en variabele sortering, die reeksen van verschillende lengtes. In beide gevallen overtrof AlphaZero de bestaande algoritmen die vaak in programma's worden gebruikt. AlphaZero bereikte verbeteringen in het sorteren van arrays van lengte 3 en 5 voor vaste sortering, en het ontdekte een intrigerende benadering om arrays van lengte 4 te sorteren voor variabele sortering.

Voor een uitgebreider begrip van de sorteeralgoritmen die door AlphaDev zijn ontdekt, raadpleegt u het Nature-artikel met de titel "AlphaDev: AlphaZero's reis naar efficiënte sorteeralgoritmen".

Lees meer over AI:

Disclaimer

In lijn met de Richtlijnen voor vertrouwensprojectenHoud er rekening mee dat de informatie op deze pagina niet bedoeld is en niet mag worden geïnterpreteerd als juridisch, fiscaal, beleggings-, financieel of enige andere vorm van advies. Het is belangrijk om alleen te beleggen wat u zich kunt veroorloven te verliezen en onafhankelijk financieel advies in te winnen als u twijfels heeft. Voor meer informatie raden wij u aan de algemene voorwaarden en de hulp- en ondersteuningspagina's van de uitgever of adverteerder te raadplegen. MetaversePost streeft naar nauwkeurige, onpartijdige berichtgeving, maar de marktomstandigheden kunnen zonder voorafgaande kennisgeving worden gewijzigd.

Over de auteur

Damir is de teamleider, productmanager en redacteur bij Metaverse Post, met onderwerpen als AI/ML, AGI, LLM's, Metaverse en Web3-gerelateerde velden. Zijn artikelen trekken maandelijks een enorm publiek van meer dan een miljoen gebruikers. Hij blijkt een expert te zijn met 10 jaar ervaring in SEO en digitale marketing. Damir is genoemd in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto en andere publicaties. Hij reist als digitale nomade tussen de VAE, Turkije, Rusland en het GOS. Damir behaalde een bachelordiploma in natuurkunde, wat hem volgens hem de kritische denkvaardigheden heeft gegeven die nodig zijn om succesvol te zijn in het steeds veranderende landschap van internet. 

Meer artikelen
Damir Jalalov
Damir Jalalov

Damir is de teamleider, productmanager en redacteur bij Metaverse Post, met onderwerpen als AI/ML, AGI, LLM's, Metaverse en Web3-gerelateerde velden. Zijn artikelen trekken maandelijks een enorm publiek van meer dan een miljoen gebruikers. Hij blijkt een expert te zijn met 10 jaar ervaring in SEO en digitale marketing. Damir is genoemd in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto en andere publicaties. Hij reist als digitale nomade tussen de VAE, Turkije, Rusland en het GOS. Damir behaalde een bachelordiploma in natuurkunde, wat hem volgens hem de kritische denkvaardigheden heeft gegeven die nodig zijn om succesvol te zijn in het steeds veranderende landschap van internet. 

Van Ripple tot The Big Green DAO: hoe cryptocurrency-projecten bijdragen aan liefdadigheid

Laten we initiatieven onderzoeken die het potentieel van digitale valuta voor goede doelen benutten.

Meer weten

AlphaFold 3, Med-Gemini en anderen: de manier waarop AI de gezondheidszorg transformeert in 2024

AI manifesteert zich op verschillende manieren in de gezondheidszorg, van het blootleggen van nieuwe genetische correlaties tot het versterken van robotchirurgische systemen...

Meer weten
Sluit u aan bij onze innovatieve technologiegemeenschap
Lees meer
Lees meer
Samenvatting van de cryptomarkt: analyse van wekelijkse trends in Bitcoin, Ethereum, Toncoin
Verteren Business markten Technologie
Samenvatting van de cryptomarkt: analyse van wekelijkse trends in Bitcoin, Ethereum, Toncoin
17 June 2024
Handelaar Joe lanceert Liquidity Book V2.2 en introduceert de functie 'Geconcentreerde Incentives'
Nieuwsverslag Technologie
Handelaar Joe lanceert Liquidity Book V2.2 en introduceert de functie 'Geconcentreerde Incentives'
17 June 2024
Crypto Exchange Binance lanceert 'Futures Grand Tournament' met een prijzenpot van 3 miljoen USDT
Lifestyle Nieuwsverslag Technologie
Crypto Exchange Binance lanceert 'Futures Grand Tournament' met een prijzenpot van 3 miljoen USDT
17 June 2024
Koreaanse cryptobeurzen staan ​​voor moeilijke beslissingen: nieuwe wet eist driemaandelijkse beoordelingen en mogelijke verwijdering van 600 altcoins
Advies Business markten Technologie
Koreaanse cryptobeurzen staan ​​voor moeilijke beslissingen: nieuwe wet eist driemaandelijkse beoordelingen en mogelijke verwijdering van 600 altcoins
17 June 2024