ニュースレポート テクノロジー
2025 年 2 月 27 日

Gensyn が協調強化学習のための RL Swarm フレームワークをリリース、3 月にテストネットの立ち上げを計画

簡単に言えば

Gensyn は、協調的な強化学習を促進するために RL Swarm を導入し、3 月にテストネットを立ち上げて、オープン マシン インテリジェンスの進歩への幅広い参加を可能にすることを発表しました。

Gensyn が協調強化学習のための RL Swarm フレームワークをリリース、3 月にテストネットの立ち上げを計画

機械知能ネットワーク、 ゲンシンは、インターネット上での協調的な強化学習を促進するために設計された分散型ピアツーピアシステムであるRL Swarmを導入しました。来月、このプロジェクトはテストネットを立ち上げ、オープンマシンインテリジェンスの進歩に幅広い参加を可能にする予定です。  

RL Swarm は、分散システム全体で強化学習モデルを集合的にトレーニングできる、完全にオープンソースのプラットフォームです。RL を活用したモデルは、単独でトレーニングするよりも、協調的な群れの一部としてトレーニングすると、学習効率が向上することを示す研究結果をリアルタイムで実証します。  

スウォーム ノードを操作すると、新しいスウォームを開始するか、パブリック アドレスを使用して既存のスウォームに接続することができます。各スウォーム内では、モデルが集合体として強化学習を行い、Hivemind に基づく分散型通信プロトコルを使用して知識の共有とモデルの改善を促進します。提供されたクライアント ソフトウェアを実行することで、参加者はスウォームに参加し、共有された更新を確認し、集合知の恩恵を受けながらローカルでモデルをトレーニングできます。今後は追加の実験が導入され、このテクノロジーの進歩への幅広い関与が促進される予定です。  

RL Swarm に参加して、システムを直接体験してください。参加には、標準的な消費者向けハードウェアと、より高度なクラウドベースの GPU リソースの両方が利用できます。

RL Swarm はどのように機能しますか? 

ゲンシン ジェンシンは、機械学習が分散化され、広大なデバイス ネットワーク全体に分散される未来を長い間思い描いてきました。このアプローチでは、大規模な集中型モデルに頼るのではなく、モデルを小規模で相互接続されたコンポーネントに分割し、それらが連携して動作するようにします。このビジョンの研究の一環として、ジェンシンは分散型学習へのさまざまな道を模索し、最近、強化学習 (RL) 後のトレーニングは、モデルが相互に通信してフィードバックを提供する場合に特に効果的であることを確認しました。  

具体的には、実験により、RL モデルは独立してトレーニングするよりも、協調的な群れの一部としてトレーニングすると学習効率が向上することが示されています。  

この設定では、各スウォーム ノードが Qwen 2.5 1.5B モデルを実行し、構造化された 8 段階のプロセスを通じて数学の問題 (GSMXNUMXK) を解決します。最初の段階では、各モデルが独立して指定された問題の解決を試み、指定された形式で推論と回答を生成します。XNUMX 番目の段階では、モデルはピアの回答を確認し、建設的なフィードバックを提供します。最後の段階では、各モデルが大多数が最適な回答と見なすと予測するものに投票し、それに応じて回答を改良します。これらの反復的なインタラクションを通じて、モデルは集合的に問題解決能力を強化します。  

実験結果によると、この方法により学習プロセスが加速され、モデルはより少ないトレーニング反復で未知のテスト データに対してより正確な応答を生成できるようになります。  

TensorBoard を使用したデータの視覚化は、参加しているスウォーム ノードで観察された主要な傾向を示しています。これらのプロットは、共同トレーニングのラウンド間で発生する定期的な「リセット」による周期的なパターンを示しています。すべてのプロットの x 軸は、ノードがスウォームに参加してからの経過時間を表し、y 軸はさまざまなパフォーマンス メトリックを伝えます。プロットは、左から右に、モデルが応答を正しくフォーマットし、数学的に正確な回答を生成したインスタンスを測定するコンセンサス正確性報酬、ルールベースの評価 (フォーマット、数学的正確性、論理的一貫性など) の加重合計である合計報酬、モデルが報酬信号に基づいて調整して学習プロセスを最適化する方法を反映するトレーニング損失、および応答で使用されるトークンの数を追跡する応答完了長さ (モデルがピア批評を受けると簡潔になることを示します) を示しています。

免責事項

に沿って トラストプロジェクトのガイドライン, このページで提供される情報は、法律、税金、投資、財務、またはその他の形式のアドバイスを目的としたものではなく、そのように解釈されるべきではないことに注意してください。 損失しても許容できる金額のみを投資し、疑問がある場合は独立した財務上のアドバイスを求めることが重要です。 詳細については、利用規約のほか、発行者または広告主が提供するヘルプおよびサポート ページを参照することをお勧めします。 MetaversePost は正確で公平なレポートに努めていますが、市場の状況は予告なく変更される場合があります。

著者について

アリサ、専属ジャーナリスト MPost、暗号通貨、ゼロ知識証明、投資、および広範な領域を専門としています。 Web3。彼女は新たなトレンドやテクノロジーに鋭い目を向け、包括的な報道を提供して、読者に情報を提供し、進化し続けるデジタル金融の状況に興味を持ってもらえるようにしています。

より多くの記事
アリサ・デビッドソン
アリサ・デビッドソン

アリサ、専属ジャーナリスト MPost、暗号通貨、ゼロ知識証明、投資、および広範な領域を専門としています。 Web3。彼女は新たなトレンドやテクノロジーに鋭い目を向け、包括的な報道を提供して、読者に情報を提供し、進化し続けるデジタル金融の状況に興味を持ってもらえるようにしています。

Hot Stories

ビットワイズ、米国選挙結果を追跡する予測市場ETFを発売へ

by アリサ・デビッドソン
2026 年 2 月 18 日
ニュースレターにご参加ください。
最新ニュース

ビットワイズ、米国選挙結果を追跡する予測市場ETFを発売へ

by アリサ・デビッドソン
2026 年 2 月 18 日

Solanaの嵐の前の静けさ:チャート、クジラ、オンチェーンシグナルが今何を語っているか

Solana は、採用の増加、機関投資家の関心、主要なパートナーシップに牽引され、強力なパフォーマンスを発揮してきましたが、潜在的なリスクにも直面しています...

詳細を見る

2025年XNUMX月の暗号通貨:主要トレンド、変化、そして今後の展望

2025 年 XNUMX 月、暗号通貨業界ではコア インフラストラクチャの強化に重点が置かれ、イーサリアムは Pectra の準備を進めていました...

詳細を見る
つづきを読む
続きを読む
MetaとNVIDIA、大規模インフラ拡張に向けて数百万個のAIチップを供給する複数年契約を締​​結
スタ-トアップ ニュースレポート テクノロジー
MetaとNVIDIA、大規模インフラ拡張に向けて数百万個のAIチップを供給する複数年契約を締​​結
2026 年 2 月 18 日
アントロピックがClaude Sonnet 4.6を発表、Opusに匹敵するパフォーマンスと拡張されたロングコンテキスト機能を実現
スタ-トアップ ニュースレポート テクノロジー
アントロピックがClaude Sonnet 4.6を発表、Opusに匹敵するパフォーマンスと拡張されたロングコンテキスト機能を実現
2026 年 2 月 18 日
柔軟な暗号資産収入をめぐる競争が激化する中、MEXCは収益利回りと貸出オプションを強化
スタ-トアップ ニュースレポート
柔軟な暗号資産収入をめぐる競争が激化する中、MEXCは収益利回りと貸出オプションを強化
2026 年 2 月 18 日
ビットワイズ、米国選挙結果を追跡する予測市場ETFを発売へ
スタ-トアップ ニュースレポート テクノロジー
ビットワイズ、米国選挙結果を追跡する予測市場ETFを発売へ
2026 年 2 月 18 日
CRYPTOMERIA LABS PTE。 株式会社。