#OpenAIReleasesGPT-5.5 GPT-5.5 是 OpenAI 最強大的人工智慧系統,被描述為「新一類的智能」,能夠自主完成多步工作。與前代產品不同,GPT-5.5 扮演真正的代理角色,撰寫與除錯程式碼、填寫試算表,以及進行深入研究,無需持續的人類監督。該模型於 2026 年 4 月 23 日發布,代號為「Spud」。
⚙️ 主要特點與架構升級
GPT-5.5 是自 GPT-4.5 以來第一個完全重新訓練的基礎模型,架構經過大幅重構。它具有 100 萬個標記的上下文窗口,能處理並理解大量文本。與 NVIDIA 深度合作開發,GPT-5.5 特別設計用於最新的 NVIDIA GB200 系統,確保最高效率。
該模型專注於代理能力,使其能自主執行撰寫程式碼、分析數據和管理多步工作流程等任務。它還支援更強大的 Codex 編碼代理,成為開發者、研究人員和企業的多功能工具。
🚀 性能提升與基準測試結果
初步基準測試顯示 GPT-5.5 超越前代產品及領先競爭者:
· 一般智能:在 GDPval 上達到 84.9%,超過 Claude Opus 4.7 的 80.3%(。
· 編碼專長:在 SWE-Bench Pro 上得分 58.6%,在 GitHub 實際問題解決中表現出色)。內部測試中,在 20 小時人類任務的 Expert-SWE 上達到 73.1%,而 GPT-