Qwen、コーディング、推論、マルチモーダルAIパフォーマンスの向上を目指した新しいビジョン言語モデルを発表
簡単に言えば
Qwen チームは、より高性能な汎用 AI エージェントに向けた幅広い取り組みの一環として、マルチモーダル パフォーマンス、強化学習、トレーニング効率の大幅な進歩を導入した、オープンウェイトの Qwen3.5‑397B‑A17B モデルをリリースしました。
Alibaba Cloud の Qwen チームは、新しい Qwen3.5 シリーズの最初のモデルとして、オープンウェイトの Qwen3.5‑397B‑A17B を発表しました。
ネイティブ ビジョン言語システムとして位置付けられるこのモデルは、推論、コーディング、エージェント タスク、マルチモーダル理解のすべてにわたって強力なパフォーマンスを提供し、同社の大規模 AI 開発の取り組みにおける大きな進歩を反映しています。
このモデルは、ゲートデルタネットワークによる線形アテンションとスパースな専門家混合設計を組み合わせたハイブリッドアーキテクチャ上に構築されており、推論時の高効率化を実現します。システム全体では397億個のパラメータが含まれますが、各フォワードパスでアクティブ化されるのはわずか17億個であるため、高い能力を維持しながら計算コストを削減できます。また、今回のリリースでは言語と方言のカバレッジが119から201に拡張され、世界中のユーザーと開発者にとってより広範なアクセスが可能になります。
Qwen3.5は強化学習と事前トレーニングの効率性において大きな飛躍を遂げました
Qwen3.5シリーズは、幅広い環境における強化学習のスケーリングを基盤として、Qwen3から大幅な性能向上を実現しました。狭いベンチマークへの最適化ではなく、タスクの難易度と一般化性の向上に注力した結果、BFCL-V4、VITA-Bench、DeepPlanning、Tool-Decathlon、MCP-Markといった評価において、エージェントのパフォーマンスが向上しました。詳細な結果については、今後の技術レポートで詳細をお伝えします。
事前トレーニングの改善は、パワー、効率性、そして汎用性に及びます。Qwen3.5は、強化された多言語、STEM、推論コンテンツを含む、大幅に大容量の視覚テキストデータでトレーニングされており、以前の兆パラメータモデルに匹敵するパフォーマンスを実現しています。高スパースMoE、ハイブリッドアテンション、安定性の改良、マルチトークン予測などのアーキテクチャのアップグレードにより、特に32トークンおよび256トークンの拡張コンテキスト長において、大幅なスループット向上が実現されています。モデルのマルチモーダル機能は、早期のテキスト・ビジョン融合と、画像、STEM教材、動画を網羅する拡張データセットによって強化されています。また、250万語彙の拡張により、ほとんどの言語でエンコードとデコードの効率が向上しています。
Qwen3.5を支えるインフラストラクチャは、効率的なマルチモーダル学習のために設計されています。異種並列処理戦略により、視覚コンポーネントと言語コンポーネントを分離することでボトルネックを回避し、スパース活性化により、テキスト、画像、動画が混在するワークロードでもほぼ完全なスループットを実現します。ネイティブFP8パイプラインにより、活性化メモリを約半分に削減し、学習速度を10%以上向上させ、大規模なトークンスケールでも安定性を維持します。
強化学習は、あらゆる規模のモデルに対応できる完全非同期フレームワークによってサポートされており、ハードウェア利用率、負荷分散、障害回復を向上させます。FP8エンドツーエンドトレーニング、投機的デコード、ロールアウトルーターリプレイ、マルチターンロールアウトロックなどの技術は、一貫性を維持し、勾配の古さを軽減するのに役立ちます。このシステムは、大規模なエージェントワークフローをサポートするように構築されており、シームレスなマルチターンインタラクションと環境をまたがる広範な汎化を可能にします。
ユーザーはQwen Chatを通じてQwen3.5と対話できます。Qwen Chatは、タスクに応じて自動、思考、高速モードを提供します。このモデルはAlibaba CloudのModelStudioからも利用可能で、推論、Web検索、コード実行といった高度な機能を簡単なパラメータ設定で有効化できます。サードパーティのコーディングツールとの統合により、開発者は既存のワークフローにQwen3.5を最小限の手間で導入できます。
Qwenチームによると、Qwen3.5は、ハイブリッドアーキテクチャとネイティブなマルチモーダル推論を通じて、汎用デジタルエージェントの基盤を確立します。今後の開発では、セッション間学習のための永続メモリ、現実世界とのインタラクションのための具現化されたインターフェース、自己主導型改善メカニズム、長期自律動作のための経済認識など、システムレベルの統合に重点を置きます。目標は、タスク固有のアシスタントから、人間と同等の信頼性の高い判断力で、複雑で複数日にわたる目標を管理できる、一貫性と持続性を備えたエージェントへと進化させることです。
免責事項
に沿って トラストプロジェクトのガイドライン, このページで提供される情報は、法律、税金、投資、財務、またはその他の形式のアドバイスを目的としたものではなく、そのように解釈されるべきではないことに注意してください。 損失しても許容できる金額のみを投資し、疑問がある場合は独立した財務上のアドバイスを求めることが重要です。 詳細については、利用規約のほか、発行者または広告主が提供するヘルプおよびサポート ページを参照することをお勧めします。 MetaversePost は正確で公平なレポートに努めていますが、市場の状況は予告なく変更される場合があります。
著者について
アリサ、専属ジャーナリスト MPost、暗号通貨、ゼロ知識証明、投資、および広範な領域を専門としています。 Web3。彼女は新たなトレンドやテクノロジーに鋭い目を向け、包括的な報道を提供して、読者に情報を提供し、進化し続けるデジタル金融の状況に興味を持ってもらえるようにしています。
より多くの記事
アリサ、専属ジャーナリスト MPost、暗号通貨、ゼロ知識証明、投資、および広範な領域を専門としています。 Web3。彼女は新たなトレンドやテクノロジーに鋭い目を向け、包括的な報道を提供して、読者に情報を提供し、進化し続けるデジタル金融の状況に興味を持ってもらえるようにしています。