🔥アリ PAI オープンソースエージェントQwen:二重データフライホイール訓練、8B性能は235Bに迫る


アリ PAI チームは、AgenticQwenシリーズモデル(8B、30B-A3B)を公開し、工業用ツール呼び出しに特化して設計しました。「二重データフライホイール」強化学習フレームワークを通じて、モデルはTAU-2とBFCL-V4のベンチマークで、8Bバージョンが平均得点47.4を獲得し、Qwen3-235Bの52.0に近づいています。30B-A3Bバージョンの得点は50.2です。このモデルは内部生産システムに展開されていますが、40Kのコンテキスト長に制限されているため、深層探索タスクには依然として制約があります。
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし