Anthropic 於 4/23 發佈 Claude Code 品質事故檢討，公開承認過去近兩個月內三個疊加的工程錯誤造成 Claude Code 使用品質下降，並同步將影響波及 Claude Agent SDK 與 Claude Cowork。公司表示「我們非常重視關於模型退化的回報，從未故意降低模型能力」，並於 4/23 為所有訂閱者重置用量上限作為補償。

三個 bug 的時間軸與技術根因

問題生效區間根因修復版本推理預算降級 3/4–4/7 reasoning effort 默認從 high 降為 medium，用戶感受模型「變笨」 4/7 回滾快取清理 bug 3/26–4/10 閒置逾 1 小時 session 的 thinking 快取每輪都被清，而非僅清一次 v2.1.101 簡潔 prompt 反噬 4/16–4/20 新增「工具呼叫間文字 ≤25 字」系統指令，ablation 測出整體智能下降 3% v2.1.116

推理降級：為降延遲付出的代價

3/4 Anthropic 將 Claude Code 的 reasoning effort 默認從 high 調整為 medium，目的是縮短回應延遲。但此變更使模型在程式碼推理與除錯任務上感覺「變笨」。4/7 回滾後，現在 Opus 4.7 默認 xhigh、其他模型維持 high。公司坦承：變更前內部評估未能偵測到此退化。

快取清理 bug：跨系統邊界的隱性錯誤

3/26 Anthropic 為閒置超過一小時的 session 導入 prompt caching 優化。原設計是「閒置滿一小時清一次 thinking 快取」，但實作上變成「閒置觸發後每一輪都清」，導致 Claude 在長 session 中表現「健忘、重複」，且每輪 cache miss 使用戶用量被快速消耗。Anthropic 指出此 bug「存在於 Claude Code 上下文管理、Anthropic API 與 extended thinking 三者的交集處」，牽涉多個系統邊界、是難以用單元測試捕捉的隱性錯誤。修復於 4/10 以 v2.1.101 發佈。

25 字簡潔指令：ablation 才發現智能下降 3%

4/16 Anthropic 加入一條系統指令：「工具呼叫間的文字輸出保持在 25 字以內」，本意是減少模型冗長解釋、讓體驗更乾淨。當下內部測試沒有發現退化，但經過更嚴謹的 ablation 對照實驗後，公司發現此指令對 Opus 4.6 與 4.7 兩個模型都造成約 3% 的整體智能下降。4/20 在 v2.1.116 回滾。此事件凸顯：系統 prompt 的微小措辭也可能對模型行為產生未預期的結構性影響。

影響範圍

產品層：Claude Code（三個問題皆受影響）、Claude Agent SDK（①②）、Claude Cowork（全部）

模型層：Sonnet 4.6、Opus 4.6、Opus 4.7

API 基礎設施：未受影響

用戶感受層面表現為：回應品質與「智能」感降低、延遲上升、conversation context 中途遺失、用量比預期燒得更快。

補償與流程改進

Anthropic 在 4/23 為所有訂閱者重置用量上限作為直接補償。同步承諾的流程改進包括：

對 system prompt 變更實施更廣的評估套件（evaluation suite）

改進 Code Review 工具提早偵測回歸

將內部測試標準化為公開 build，避免「內部版本」與「對外版本」行為分歧

為可能影響模型智能的變更加入 soak period 與漸進式 rollout

對使用者的啟示

對依賴 Claude Code 進行日常開發與研究的使用者而言，這份 postmortem 有三個可帶走的重點：第一，若你在 3 月中到 4 月 20 日間感受到 Claude 模型「變笨」、或是 Claude Code 對長 session 異常遺忘，那並非你的錯覺或 prompt 不當；第二，這段期間用量上限被快速吃光的用戶，可於 4/23 後確認 Anthropic 是否已自動重置；第三，即便是一條「25 字以內」的 prompt 微調，也可能對模型全域行為產生系統性影響——這是 LLM 產品工程的共通風險。

相較同業多以沉默或「這是使用者操作不當」回應模型退化質疑，Anthropic 這次的主動揭露與技術透明度，為 AI 產品事故檢討設下一個可參考的樣本。

這篇文章 Anthropic 自揭 Claude Code 三 bug 疊加：推理降級、快取遺忘、25 字指令反噬最早出現於鏈新聞 ABMedia。

免责声明：本页面信息可能来自第三方，不代表 Gate 的观点或意见。页面显示的内容仅供参考，不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证，对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为，价格波动剧烈，您可能损失全部投资本金。请充分了解相关风险，并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明。

寒武纪Q1营收翻倍，受益于中国人工智能芯片的推动

AI 行业动态

据彭博社报道，寒武纪科技第一季度营收增至29亿元人民币 ($421 百万)，高于一年前的11亿元人民币 ($162 百万)；净利润增至10亿元人民币 ($148 百万)，高于3.56亿元人民币 ($52.1 million)。这家中国人工智能芯片制造商

GateNews5 分钟前

以色列医疗 AI 初创公司 Aidoc 融资 $150M 百万，由高盛基金领投

AI 行业动态

据 Axios 称，以色列医疗影像 AI 初创公司 Aidoc 在一轮融资中筹集了 $150 百万资金，该轮融资由高盛旗下管理的基金领投，距其上一轮融资不到一年。本轮融资使 Aidoc 的总资本达到超过 $500 百万。投资者还包括英伟达旗下 NVentures、General Catalyst 和亚马逊网络服务。Aidoc 将使用这笔资金来开发 CARE，这是一种在数千万份医学影像扫描上训练的基础模型。美国食品药品监督管理局于 2026 年 1 月批准了 CARE 的 11 项新适应症，使 Aidoc 的总批准项目数达到超过 30 项。该公司的工具目前已部署在全球超过 1,600 家医疗中心。

GateNews1小时前

Illuminate Financial 为人工智能与金融科技初创企业敲定 $135M 早期成长基金

AI 行业动态

据 Illuminate Financial 称，总部位于伦敦的风险投资公司已完成一支 $135 百万的早期成长基金，用于投资 B 轮以及后期阶段的企业级人工智能和金融科技初创企业。该基金的支持方包括 8 家主要金融机构：BNP Paribas、Citi、Deutsche Börse、HSBC、Jefferies、RBC、S&P Global 和 TD Securities。这标志着该公司的第四支基金，也是其首支聚焦后期交易的基金。

GateNews1小时前

软银计划今年在美国推出并上市 AI 机器人公司 Roze，目标估值为 $100B

AI 行业动态

据《金融时报》报道，软银集团计划于今年在美国设立并上市一家名为 Roze 的独立人工智能机器人与数据中心公司，目标估值为 $100 十亿美元。CEO 孙正义正在推动这一举措，该举措旨在利用公司在人工智能领域的大规模投资。

GateNews1小时前

Anthropic 寻求融资，估值或超过 9000 亿美元，可能超越 OpenAI

AI 行业动态

据@Jin Ten@称，Anthropic 正计划在 4 月 30 日进行一轮新的融资，其对公司的估值将超过 $900 billion，可能使其成为全球最有价值的 AI 初创公司，并超越 OpenAI。该公司管理层正在审查多份可能使其估值翻倍以上的投资者提案。

GateNews1小时前

Anthropic 考虑新融资，估值超越 OpenAI 成为估值最高的 AI 新创

AI 行业动态

人工智能开发商 Anthropic 正处于新一轮融资的初步评估阶段，市场估值有望突破 9,000 亿美元。若此轮融资顺利完成，该公司将超越其竞争对手 OpenAI，成为全球估值最高的 AI 新创企业。随着生成式 AI 技术的快速普及，Anthropic 正积极寻求资金以扩充基础设施，并传出最快于今年十月进行首次公开募股（IPO）。科技巨头如 Google 与 Amazon 先前已投入巨资，显示资本市场对其技术潜力的高度重视。 Anthropic 融资规模与估值成长分析彭博社引述知情人士报道，Anthropic 正处于新一轮融资的初步评估阶段，其企业估值有望突破 9,000 亿美元。与今年

鏈新聞abmedia1小时前

0/400

暂无评论