Novinky Technika
Června 20, 2023

AlphaZero společnosti DeepMind se učí efektivní třídicí algoritmy v optimalizaci neuronové sítě

Stručně

AlphaZero od DeepMind se učí efektivní třídicí algoritmy hraním třídicí hry s využitím technik posilování.

DeepMind opět pokročil v oblasti strojového učení. Po jejich úspěchu při používání posilovacího učení (RL) k efektivnější výuce AlphaZero maticové násobící algoritmy, na které nyní obrátili svou pozornost algoritmy třídění, se slibnými výsledky.

AlphaZero společnosti DeepMind se učí efektivní třídicí algoritmy v optimalizaci neuronové sítě
deepmind.com

Třídění je základní operace používaná v mnoha počítačových programech. Účinnost třídicích polí, provádění úkolu s co nejmenším počtem operací, má velký význam. Tradičně výzkumníci navrhli různé účinné třídicí algoritmy pro různé scénáře založené na velikostech polí a charakteristikách dat. DeepMind se však rozhodl prozkoumat nový přístup: výuka a nervová síť k vyřešení tohoto problému.

Aby toho dosáhl, DeepMind zavedl úkol seřadit pole jako hru do AlphaZero. Prostřednictvím technik RL vycvičili AlphaZero, aby hrál tuto třídící hru. Výsledný model, známý jako AlphaDev, ukázal pozoruhodné schopnosti v učení efektivních třídicích algoritmů.

Třídicí hra funguje tak, že představuje stav prostředí jako pár, kde P označuje aktuální třídicí algoritmus generovaný v assembleru a Z představuje stav paměti a registrů. V každém časovém kroku agent AlphaZero vezme aktuální stav jako vstup a provede akci, která zahrnuje přidání nové instrukce do algoritmu jazyka assembler, jako je mov.

AlphaZero krok za krokem konstruuje konečný třídicí algoritmus v jazyce symbolických instrukcí. Odměna modelu v každém kroku je určena dvěma faktory: správností získaného algoritmu a jeho latencí. Správnost se hodnotí na základě predefined vstupně-výstupní páry, kde vstup představuje nesetříděné pole a výstup představuje stejné pole, ale seřazené.

Proces generování třídícího algoritmu pokračuje po předem stanovený počet kroků. Pokud v tomto časovém rámci není získán konečný pracovní algoritmus, proces generování začíná znovu.

Trénovaný model měl za úkol vytvořit třídicí algoritmy pro sekvence délky 3, 4 a 5. Stojí za zmínku, že existují dva typy třídicích algoritmů: pevné třídění, které třídí pole určité délky, a proměnné třídění, které dokáže zpracovat pole různých délek. V obou případech AlphaZero překonal stávající algoritmy běžně používané v programech. AlphaZero dosáhl vylepšení v řazení polí délky 3 a 5 pro pevné řazení a objevil zajímavý přístup k řazení polí délky 4 pro proměnné řazení.

Pro komplexnější pochopení třídicích algoritmů objevených AlphaDev se podívejte do článku Nature s názvem „AlphaDev: AlphaZero's Journey into Efficient Sorting Algorithms“.

Přečtěte si více o AI:

Odmítnutí odpovědnosti

V souladu s Pokyny k projektu Trust, prosím vezměte na vědomí, že informace uvedené na této stránce nejsou určeny a neměly by být vykládány jako právní, daňové, investiční, finanční nebo jakékoli jiné formy poradenství. Je důležité investovat jen to, co si můžete dovolit ztratit, a v případě pochybností vyhledat nezávislé finanční poradenství. Pro další informace doporučujeme nahlédnout do smluvních podmínek a také na stránky nápovědy a podpory poskytnuté vydavatelem nebo inzerentem. MetaversePost se zavázala poskytovat přesné a nezaujaté zprávy, ale podmínky na trhu se mohou bez upozornění změnit.

O autorovi

Damir je vedoucí týmu, produktový manažer a editor ve společnosti Metaverse Post, pokrývající témata jako AI/ML, AGI, LLM, Metaverse a Web3- související obory. Jeho články přitahují každý měsíc masivní publikum čítající více než milion uživatelů. Jeví se jako odborník s 10 lety zkušeností v oblasti SEO a digitálního marketingu. Damir byl zmíněn v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a další publikace. Jako digitální nomád cestuje mezi SAE, Tureckem, Ruskem a SNS. Damir získal bakalářský titul z fyziky, o kterém se domnívá, že mu dal dovednosti kritického myšlení potřebné k úspěchu v neustále se měnícím prostředí internetu. 

Další články
Damir Yalalov
Damir Yalalov

Damir je vedoucí týmu, produktový manažer a editor ve společnosti Metaverse Post, pokrývající témata jako AI/ML, AGI, LLM, Metaverse a Web3- související obory. Jeho články přitahují každý měsíc masivní publikum čítající více než milion uživatelů. Jeví se jako odborník s 10 lety zkušeností v oblasti SEO a digitálního marketingu. Damir byl zmíněn v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a další publikace. Jako digitální nomád cestuje mezi SAE, Tureckem, Ruskem a SNS. Damir získal bakalářský titul z fyziky, o kterém se domnívá, že mu dal dovednosti kritického myšlení potřebné k úspěchu v neustále se měnícím prostředí internetu. 

Institucionální apetit roste směrem k bitcoinovým ETF uprostřed volatility

Zveřejnění prostřednictvím podání 13F odhaluje, že pozoruhodní institucionální investoři fušují do bitcoinových ETF, což podtrhuje rostoucí akceptaci...

Vědět více

Přichází den odsouzení: Osud CZ visí v rovnováze, protože americký soud zvažuje žalobu ministerstva spravedlnosti

Changpeng Zhao je dnes připraven čelit rozsudku u amerického soudu v Seattlu.

Vědět více
Připojte se k naší komunitě inovativních technologií
Více
Dozvědět se více
Notcoin ke spuštění na OKX Jumpstart nabízí 1.25 % celkové dodávky tokenů pro těžbu
Trhy Novinky Technika
Notcoin ke spuštění na OKX Jumpstart nabízí 1.25 % celkové dodávky tokenů pro těžbu
9
Puffer Finance spouští svou hlavní síť, zlepšuje začlenění operátorů uzlů pro decentralizaci sítě
Novinky Technika
Puffer Finance spouští svou hlavní síť, zlepšuje začlenění operátorů uzlů pro decentralizaci sítě
9
Společnost Nexo zahajuje „hon“, aby odměnila uživatele 12 miliony dolarů v tokenech NEXO za zapojení do jejího ekosystému
Trhy Novinky Technika
Společnost Nexo zahajuje „hon“, aby odměnila uživatele 12 miliony dolarů v tokenech NEXO za zapojení do jejího ekosystému
8
Revolut X Exchange Crypto Traders s nulovými poplatky za tvůrce a pokročilou analýzou
Trhy Vývoj Příběhy a recenze Technika
Revolut X Exchange Crypto Traders s nulovými poplatky za tvůrce a pokročilou analýzou
8
CRYPTOMERIA LABS PTE. LTD.