Новостной репортаж Технологии
20 июня 2023

AlphaZero от DeepMind изучает эффективные алгоритмы сортировки в оптимизации нейронных сетей

Коротко

AlphaZero от DeepMind изучает эффективные алгоритмы сортировки, играя в сортировочную игру с использованием методов обучения с подкреплением.

DeepMind в очередной раз добился прогресса в машинном обучении. После их успеха в использовании обучения с подкреплением (RL), чтобы научить AlphaZero более эффективно алгоритмы умножения матриц, теперь они обратили свое внимание на алгоритмы сортировки, с многообещающими результатами.

AlphaZero от DeepMind изучает эффективные алгоритмы сортировки в оптимизации нейронных сетей
Deepmind.com

Сортировка — это основная операция, используемая во многих компьютерных программах. Большое значение имеет эффективность сортировки массивов, выполнение задачи за наименьшее количество операций. Традиционно исследователи разрабатывали различные эффективные алгоритмы сортировки для различных сценариев на основе размеров массивов и характеристик данных. Однако DeepMind решила изучить новый подход: обучение нейронной сети Для решения этой проблемы.

Для этого DeepMind ввел в AlphaZero задачу сортировки массива в виде игры. С помощью методов RL они научили AlphaZero играть в эту сортировочную игру. Получившаяся модель, известная как AlphaDev, продемонстрировала замечательные возможности в изучении эффективных алгоритмов сортировки.

Игра сортировки работает, представляя состояние среды в виде пары, где P обозначает текущий алгоритм сортировки, сгенерированный на языке ассемблера, а Z представляет состояние памяти и регистров. На каждом временном шаге агент AlphaZero принимает текущее состояние в качестве входных данных и выполняет действие, которое включает в себя добавление новой инструкции в алгоритм языка ассемблера, например, mov.

Шаг за шагом AlphaZero строит окончательный алгоритм сортировки на языке ассемблера. Награда модели на каждом шаге определяется двумя факторами: правильностью полученного алгоритма и его задержкой. Правильность оценивается на основе предварительнойdefined пары вход-выход, где вход представляет собой несортированный массив, а выход представляет тот же массив, но отсортированный.

Процесс генерации алгоритма сортировки продолжается в течение заданного количества шагов. Если за это время окончательный рабочий алгоритм не получен, процесс генерации начинается заново.

Перед обученной моделью была поставлена ​​задача создать алгоритмы сортировки для последовательностей длины 3, 4 и 5. Стоит отметить, что существует два типа алгоритмов сортировки: фиксированная сортировка, которая сортирует массивы определенной длины, и переменная сортировка, которая может обрабатывать массивы разной длины. В обоих случаях AlphaZero превосходил существующие алгоритмы, обычно используемые в программах. AlphaZero добилась улучшений в сортировке массивов длины 3 и 5 для фиксированной сортировки и обнаружила интригующий подход к сортировке массивов длины 4 для переменной сортировки.

Для более полного понимания алгоритмов сортировки, открытых AlphaDev, обратитесь к статье в Nature под названием «AlphaDev: путь AlphaZero к эффективным алгоритмам сортировки».

Подробнее об ИИ:

Отказ от ответственности

В соответствии с Руководство трастового проектаОбратите внимание, что информация, представленная на этой странице, не предназначена и не должна интерпретироваться как юридическая, налоговая, инвестиционная, финансовая или любая другая форма консультации. Важно инвестировать только то, что вы можете позволить себе потерять, и обращаться за независимой финансовой консультацией, если у вас есть какие-либо сомнения. Для получения дополнительной информации мы предлагаем обратиться к положениям и условиям, а также к страницам справки и поддержки, предоставленным эмитентом или рекламодателем. MetaversePost стремится предоставлять точную и объективную отчетность, однако рыночные условия могут быть изменены без предварительного уведомления.

Об авторе

Дамир — руководитель группы, менеджер по продукту и редактор в Metaverse Post, охватывающие такие темы, как AI/ML, AGI, LLM, Metaverse и Web3-связанные поля. Его статьи ежемесячно привлекают огромную аудиторию, насчитывающую более миллиона пользователей. Похоже, он эксперт с 10-летним опытом работы в области SEO и цифрового маркетинга. Дамир упоминается в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и другие издания. Он путешествует между ОАЭ, Турцией, Россией и СНГ в качестве цифрового кочевника. Дамир получил степень бакалавра в области физики, что, по его мнению, дало ему навыки критического мышления, необходимые для достижения успеха в постоянно меняющемся мире Интернета. 

Другие статьи
Дамир Ялалов
Дамир Ялалов

Дамир — руководитель группы, менеджер по продукту и редактор в Metaverse Post, охватывающие такие темы, как AI/ML, AGI, LLM, Metaverse и Web3-связанные поля. Его статьи ежемесячно привлекают огромную аудиторию, насчитывающую более миллиона пользователей. Похоже, он эксперт с 10-летним опытом работы в области SEO и цифрового маркетинга. Дамир упоминается в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и другие издания. Он путешествует между ОАЭ, Турцией, Россией и СНГ в качестве цифрового кочевника. Дамир получил степень бакалавра в области физики, что, по его мнению, дало ему навыки критического мышления, необходимые для достижения успеха в постоянно меняющемся мире Интернета. 

Hot Stories
Подпишитесь на нашу рассылку.
Новости

Институциональный аппетит к биткойн-ETF растет на фоне волатильности

Раскрытие информации через отчеты 13F показывает, что известные институциональные инвесторы балуются биткойн-ETF, подчеркивая растущее признание...

Узнать больше

Наступил день вынесения приговора: судьба CZ висит на волоске, поскольку суд США рассматривает ходатайство Министерства юстиции

Чанпэн Чжао сегодня предстанет перед судом США в Сиэтле.

Узнать больше
Присоединяйтесь к нашему сообществу инновационных технологий
Узнать больше
Читать далее
Пересмотренный закон Южной Кореи о пожертвованиях: это шаг вперед или назад для криптофилантропии?
Крипта Wiki Digest Бизнес Области применения: Технологии
Пересмотренный закон Южной Кореи о пожертвованиях: это шаг вперед или назад для криптофилантропии?
8 мая 2024
Генеративный ИИ в 2024 году: новые тенденции, прорывы и перспективы на будущее
AI Wiki Software Истории и обзоры Технологии
Генеративный ИИ в 2024 году: новые тенденции, прорывы и перспективы на будущее
8 мая 2024
DODOchain представляет первую фазу основной сети MACH AVS и запускает кампанию Launchpool с AltLayer, чтобы стимулировать операторов с помощью экосистемных вознаграждений
Области применения: Новостной репортаж Технологии
DODOchain представляет первую фазу основной сети MACH AVS и запускает кампанию Launchpool с AltLayer, чтобы стимулировать операторов с помощью экосистемных вознаграждений
8 мая 2024
zkSync представит P256Verify, Bridgehub и Valdiums, поддерживающие расширенные функции в следующем обновлении
Новостной репортаж Технологии
zkSync представит P256Verify, Bridgehub и Valdiums, поддерживающие расширенные функции в следующем обновлении
8 мая 2024
CRYPTOMERIA LABS PTE. ООО