Anthropic 於 4/23 發佈 Claude Code 品質事故檢討，公開承認過去近兩個月內三個疊加的工程錯誤造成 Claude Code 使用品質下降，並同步將影響波及 Claude Agent SDK 與 Claude Cowork。公司表示「我們非常重視關於模型退化的回報，從未故意降低模型能力」，並於 4/23 為所有訂閱者重置用量上限作為補償。

三個 bug 的時間軸與技術根因

問題生效區間根因修復版本推理預算降級 3/4–4/7 reasoning effort 默認從 high 降為 medium，用戶感受模型「變笨」 4/7 回滾快取清理 bug 3/26–4/10 閒置逾 1 小時 session 的 thinking 快取每輪都被清，而非僅清一次 v2.1.101 簡潔 prompt 反噬 4/16–4/20 新增「工具呼叫間文字 ≤25 字」系統指令，ablation 測出整體智能下降 3% v2.1.116

推理降級：為降延遲付出的代價

3/4 Anthropic 將 Claude Code 的 reasoning effort 默認從 high 調整為 medium，目的是縮短回應延遲。但此變更使模型在程式碼推理與除錯任務上感覺「變笨」。4/7 回滾後，現在 Opus 4.7 默認 xhigh、其他模型維持 high。公司坦承：變更前內部評估未能偵測到此退化。

快取清理 bug：跨系統邊界的隱性錯誤

3/26 Anthropic 為閒置超過一小時的 session 導入 prompt caching 優化。原設計是「閒置滿一小時清一次 thinking 快取」，但實作上變成「閒置觸發後每一輪都清」，導致 Claude 在長 session 中表現「健忘、重複」，且每輪 cache miss 使用戶用量被快速消耗。Anthropic 指出此 bug「存在於 Claude Code 上下文管理、Anthropic API 與 extended thinking 三者的交集處」，牽涉多個系統邊界、是難以用單元測試捕捉的隱性錯誤。修復於 4/10 以 v2.1.101 發佈。

25 字簡潔指令：ablation 才發現智能下降 3%

4/16 Anthropic 加入一條系統指令：「工具呼叫間的文字輸出保持在 25 字以內」，本意是減少模型冗長解釋、讓體驗更乾淨。當下內部測試沒有發現退化，但經過更嚴謹的 ablation 對照實驗後，公司發現此指令對 Opus 4.6 與 4.7 兩個模型都造成約 3% 的整體智能下降。4/20 在 v2.1.116 回滾。此事件凸顯：系統 prompt 的微小措辭也可能對模型行為產生未預期的結構性影響。

影響範圍

產品層：Claude Code（三個問題皆受影響）、Claude Agent SDK（①②）、Claude Cowork（全部）

模型層：Sonnet 4.6、Opus 4.6、Opus 4.7

API 基礎設施：未受影響

用戶感受層面表現為：回應品質與「智能」感降低、延遲上升、conversation context 中途遺失、用量比預期燒得更快。

補償與流程改進

Anthropic 在 4/23 為所有訂閱者重置用量上限作為直接補償。同步承諾的流程改進包括：

對 system prompt 變更實施更廣的評估套件（evaluation suite）

改進 Code Review 工具提早偵測回歸

將內部測試標準化為公開 build，避免「內部版本」與「對外版本」行為分歧

為可能影響模型智能的變更加入 soak period 與漸進式 rollout

對使用者的啟示

對依賴 Claude Code 進行日常開發與研究的使用者而言，這份 postmortem 有三個可帶走的重點：第一，若你在 3 月中到 4 月 20 日間感受到 Claude 模型「變笨」、或是 Claude Code 對長 session 異常遺忘，那並非你的錯覺或 prompt 不當；第二，這段期間用量上限被快速吃光的用戶，可於 4/23 後確認 Anthropic 是否已自動重置；第三，即便是一條「25 字以內」的 prompt 微調，也可能對模型全域行為產生系統性影響——這是 LLM 產品工程的共通風險。

相較同業多以沉默或「這是使用者操作不當」回應模型退化質疑，Anthropic 這次的主動揭露與技術透明度，為 AI 產品事故檢討設下一個可參考的樣本。

這篇文章 Anthropic 自揭 Claude Code 三 bug 疊加：推理降級、快取遺忘、25 字指令反噬最早出現於鏈新聞 ABMedia。

免責聲明：本頁面資訊可能來自第三方，不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考，不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證，對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為，價格波動劇烈，您可能損失全部投資本金。請充分了解相關風險，並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明。

AI 金融平台 Rogo 在不到 3 個月內完成 B 輪融資，由 Kleiner Perkins 領投

AI Agent AI 行業動態

根據 Beating 的說法，為高頻金融情境而設計的 AI 平台 Rogo 於 2026 年 4 月完成了一輪 $160 百萬美元的 B 輪融資，由 Kleiner Perkins 領投，並有 Sequoia、Thrive Capital、Khosla Ventures 以及 J.P. Morgan 參與。本輪融資在該公司於 1 月下旬完成百萬美元的 C 輪融資後不到三個月，使總融資額超過百萬美元。 Rogo 同步推出 Felix，這是一個面向金融專業人士的 AI 代理平台。該平台使投資銀行家與分析師能夠將金融建模、報表分析與簡報製作等多步任務委派給 Felix，從而騰出時間投入高槓桿的客戶工作。目前，該平台已被超過 35,000 名專業人士使用，覆蓋超過 250 家頂級投資銀行、資產管理公司以及私募股權公司。

GateNews6小時前

China Blocks Meta-Backed Manus AI Acquisition on April 29, Citing Tech and Data Security Concerns

AI Agent AI 行業動態

According to PANews, on April 29, China's National Development and Reform Commission investment security review office banned a foreign acquisition of the Manus project and required the transaction be terminated. Manus, billed as the world's first general artificial intelligence agent, had

GateNews6小時前

阿里雲將 DeepSeek-V4-Pro 隱式快取定價調降至 4 月 29 日起每 100 萬個 tokens 1 元

AI 行業動態

根據阿里雲的說明，其百炼平台將把 DeepSeek-V4-Pro 模型的隱式快取 (Implicit Cache) 的定價降低至自 2026 年 4 月 29 日 23:59:59（北京時間）起，每 100 萬個 tokens 收費 1 元。僅當請求命中快取時才適用隱式快取；快取中的輸入 tokens 將按快取的 cached_token 費率計費，而未命中快取的輸入 tokens 則按標準 input_token 費率收費。此調整僅影響隱式快取的定價；基礎模型推論費率維持不變。

GateNews7小時前

AI 平台 Certifyde 以 $2M 種子輪融資邀請 Ripple 執行長 Brad Garlinghouse 入局

AI 行業動態

根據 ChainCatcher 報道，AI 應用平台 Certifyde 宣布完成一輪 $2 百萬美元種子輪融資。投資方包括 K5 Global、Flamingo Capital，以及天使投資人，例如 Ripple 執行長 Brad Garlinghouse、Honey 聯合創始人 George Ruan，以及 Nutra 聯合創始人 Roland Peralta。

GateNews9小時前

DeepSeek 於測試版中推出影像辨識功能

AI 行業動態

根據 PANews，DeepSeek 於今天 (April 29) 推出了其影像辨識功能，目前處於測試版。網頁版與行動應用程式的使用者都有可能被選中參與測試版推送。

GateNews10小時前

留言

0/400

暫無留言