Haber Raporu Teknoloji
Haziran 20, 2023

DeepMind'den AlphaZero, Sinir Ağı Optimizasyonunda Verimli Sıralama Algoritmalarını Öğreniyor

Kısaca

DeepMind'den AlphaZero, pekiştirmeli öğrenme tekniklerini kullanarak bir sıralama oyunu oynayarak verimli sıralama algoritmalarını öğrenir.

DeepMind, makine öğreniminde bir kez daha ilerleme kaydetti. AlphaZero'yu daha verimli öğretmek için pekiştirmeli öğrenimi (RL) kullanmadaki başarılarının ardından matris çarpma algoritmalarışimdi dikkatlerini şuna çevirdiler: sıralama algoritmaları, umut verici sonuçlarla.

DeepMind'den AlphaZero, Sinir Ağı Optimizasyonunda Verimli Sıralama Algoritmalarını Öğreniyor
derinmind.com

Sıralama, birçok bilgisayar programında kullanılan temel bir işlemdir. Görevi mümkün olan en az işlemle gerçekleştiren dizileri sıralamanın verimliliği büyük önem taşımaktadır. Geleneksel olarak, araştırmacılar, dizi boyutlarına ve veri özelliklerine dayalı olarak farklı senaryolar için çeşitli verimli sıralama algoritmaları tasarladılar. Ancak DeepMind yeni bir yaklaşım keşfetmeye karar verdi: sinir ağı bu problemi çözmek için.

Bunu başarmak için DeepMind, bir diziyi bir oyun olarak sıralama görevini AlphaZero'ya tanıttı. RL teknikleriyle AlphaZero'yu bu sıralama oyununu oynaması için eğittiler. AlphaDev olarak bilinen ortaya çıkan model, verimli sıralama algoritmalarını öğrenmede dikkate değer yetenekler sergiledi.

Sıralama oyunu, ortamın durumunu bir çift olarak temsil ederek çalışır; burada P, montaj dilinde oluşturulan geçerli sıralama algoritmasını belirtir ve Z, bellek ve kayıtların durumunu temsil eder. Her zaman adımında, AlphaZero aracısı mevcut durumu girdi olarak alır ve birleştirici dil algoritmasına mov gibi yeni bir talimat eklemeyi içeren bir eylem gerçekleştirir.

AlphaZero, montaj dilinde son sıralama algoritmasını adım adım oluşturur. Modelin her adımdaki ödülü iki faktör tarafından belirlenir: elde edilen algoritmanın doğruluğu ve gecikmesi. Doğruluk ön değerlendirmeye göre değerlendirilirdefiNed giriş-çıkış çiftleri; burada giriş sıralanmamış bir diziyi temsil eder ve çıktı aynı diziyi ancak sıralanmış olarak temsil eder.

Sıralama algoritmasını oluşturma işlemi, önceden belirlenmiş sayıda adım için devam eder. Bu süre içinde nihai bir çalışma algoritması elde edilemezse, üretim süreci yeniden başlar.

Eğitilen model, 3, 4 ve 5 uzunluğundaki diziler için sıralama algoritmaları üretmekle görevlendirildi. İki tür sıralama algoritması olduğunu belirtmekte fayda var: belirli bir uzunluktaki dizileri sıralayan sabit sıralama ve işleyebilen değişken sıralama. farklı uzunluklarda diziler. Her iki durumda da AlphaZero, programlarda yaygın olarak kullanılan mevcut algoritmaları geride bıraktı. AlphaZero, sabit sıralama için 3 ve 5 uzunluğundaki dizileri sıralamada iyileştirmeler elde etti ve değişken sıralama için 4 uzunluğundaki dizileri sıralamak için ilgi çekici bir yaklaşım keşfetti.

AlphaDev tarafından keşfedilen sıralama algoritmalarını daha kapsamlı bir şekilde anlamak için, “AlphaDev: AlphaZero's Journey into Efficient Sorting Algorithms” başlıklı Nature makalesine bakın.

AI hakkında daha fazlasını okuyun:

Feragatname

Doğrultusunda Trust Project yönergeleri, lütfen bu sayfada sağlanan bilgilerin hukuki, vergi, yatırım, finansal veya başka herhangi bir tavsiye niteliğinde olmadığını ve bu şekilde yorumlanmaması gerektiğini unutmayın. Yalnızca kaybetmeyi göze alabileceğiniz kadar yatırım yapmak ve herhangi bir şüpheniz varsa bağımsız finansal tavsiye almak önemlidir. Daha fazla bilgi için şartlar ve koşulların yanı sıra kartı veren kuruluş veya reklamveren tarafından sağlanan yardım ve destek sayfalarına bakmanızı öneririz. MetaversePost doğru, tarafsız raporlamaya kendini adamıştır, ancak piyasa koşulları önceden haber verilmeksizin değiştirilebilir.

Yazar hakkında

Damir şu anda ekip lideri, ürün yöneticisi ve editördür: Metaverse Post, AI/ML, AGI, LLM'ler, Metaverse ve Web3-İlgili alanlar. Makaleleri, her ay bir milyondan fazla kullanıcıdan oluşan büyük bir kitleyi kendine çekiyor. SEO ve dijital pazarlama konusunda 10 yıllık deneyime sahip bir uzman gibi görünüyor. Damir'den Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ve diğer yayınlar. Dijital bir göçebe olarak BAE, Türkiye, Rusya ve BDT arasında seyahat ediyor. Damir, kendisine internetin sürekli değişen ortamında başarılı olmak için gereken eleştirel düşünme becerilerini verdiğine inandığı fizik alanında lisans derecesi aldı. 

Daha fazla haber
Damir Yalalov
Damir Yalalov

Damir şu anda ekip lideri, ürün yöneticisi ve editördür: Metaverse Post, AI/ML, AGI, LLM'ler, Metaverse ve Web3-İlgili alanlar. Makaleleri, her ay bir milyondan fazla kullanıcıdan oluşan büyük bir kitleyi kendine çekiyor. SEO ve dijital pazarlama konusunda 10 yıllık deneyime sahip bir uzman gibi görünüyor. Damir'den Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ve diğer yayınlar. Dijital bir göçebe olarak BAE, Türkiye, Rusya ve BDT arasında seyahat ediyor. Damir, kendisine internetin sürekli değişen ortamında başarılı olmak için gereken eleştirel düşünme becerilerini verdiğine inandığı fizik alanında lisans derecesi aldı. 

Volatilite Ortasında Bitcoin ETF'lerine Yönelik Kurumsal İştah Artıyor

13F başvuruları aracılığıyla yapılan açıklamalar, önemli kurumsal yatırımcıların Bitcoin ETF'leriyle uğraştığını ortaya koyuyor ve Bitcoin ETF'lerinin artan bir şekilde kabul edildiğinin altını çiziyor.

bilmek Daha

Hüküm Günü Geliyor: ABD Mahkemesi Adalet Bakanlığı'nın Savunmasını Değerlendirirken CZ'nin Kaderi Dengede

Changpeng Zhao bugün Seattle'daki bir ABD mahkemesinde cezayla karşı karşıya kalmaya hazırlanıyor.

bilmek Daha
Yenilikçi Teknoloji Topluluğumuza Katılın
Devamını Oku
Daha fazla
Kripto Borsası OKX, 16 Mayıs'ta NOT-USDT Çiftiyle Spot Ticarete Başlayacak Notcoin'i Listeliyor
Piyasalar Haber Raporu Teknoloji
Kripto Borsası OKX, 16 Mayıs'ta NOT-USDT Çiftiyle Spot Ticarete Başlayacak Notcoin'i Listeliyor  
Mayıs 10, 2024
Blast Üçüncü Blast Altın Dağıtım Etkinliğini Başlattı, DApp'lere 15 Milyon Puan Ayırdı
Piyasalar Haber Raporu Teknoloji
Blast Üçüncü Blast Altın Dağıtım Etkinliğini Başlattı, DApp'lere 15 Milyon Puan Ayırdı
Mayıs 10, 2024
Espresso Systems, Toplamanın Birlikte Çalışabilirliğini Artırmak İçin AggLayer'ı Geliştirmek İçin Polygon Laboratuvarlarıyla İşbirliği Yapıyor
İşletme Haber Raporu Teknoloji
Espresso Systems, Toplamanın Birlikte Çalışabilirliğini Artırmak İçin AggLayer'ı Geliştirmek İçin Polygon Laboratuvarlarıyla İşbirliği Yapıyor
Mayıs 9, 2024
ZKP Destekli Altyapı Protokolü ZKBase Yol Haritasını Açıkladı, Mayıs Ayında Testnet Lansmanını Planlıyor
Haber Raporu Teknoloji
ZKP Destekli Altyapı Protokolü ZKBase Yol Haritasını Açıkladı, Mayıs Ayında Testnet Lansmanını Planlıyor
Mayıs 9, 2024
CRYPTOMERIA LABS PTE. LTD.