🔥アリ PAI オープンソースエージェントQwen:二重データフライホイール訓練、8B性能は235Bに迫る
アリ PAI チームは、AgenticQwenシリーズモデル(8B、30B-A3B)を公開し、工業用ツール呼び出しに特化して設計しました。「二重データフライホイール」強化学習フレームワークを通じて、モデルはTAU-2とBFCL-V4のベンチマークで、8Bバージョンが平均得点47.4を獲得し、Qwen3-235Bの52.0に近づいています。30B-A3Bバージョンの得点は50.2です。このモデルは内部生産システムに展開されていますが、40Kのコンテキスト長に制限されているため、深層探索タスクには依然として制約があります。
🔥アリ PAI オープンソースエージェントQwen:二重データフライホイール訓練、8B性能は235Bに迫る
アリ PAI チームは、AgenticQwenシリーズモデル(8B、30B-A3B)を公開し、工業用ツール呼び出しに特化して設計しました。「二重データフライホイール」強化学習フレームワークを通じて、モデルはTAU-2とBFCL-V4のベンチマークで、8Bバージョンが平均得点47.4を獲得し、Qwen3-235Bの52.0に近づいています。30B-A3Bバージョンの得点は50.2です。このモデルは内部生産システムに展開されていますが、40Kのコンテキスト長に制限されているため、深層探索タスクには依然として制約があります。