Anthropic 於 4/23 發佈 Claude Code 品質事故檢討，公開承認過去近兩個月內三個疊加的工程錯誤造成 Claude Code 使用品質下降，並同步將影響波及 Claude Agent SDK 與 Claude Cowork。公司表示「我們非常重視關於模型退化的回報，從未故意降低模型能力」，並於 4/23 為所有訂閱者重置用量上限作為補償。

三個 bug 的時間軸與技術根因

問題生效區間根因修復版本推理預算降級 3/4–4/7 reasoning effort 默認從 high 降為 medium，用戶感受模型「變笨」 4/7 回滾快取清理 bug 3/26–4/10 閒置逾 1 小時 session 的 thinking 快取每輪都被清，而非僅清一次 v2.1.101 簡潔 prompt 反噬 4/16–4/20 新增「工具呼叫間文字 ≤25 字」系統指令，ablation 測出整體智能下降 3% v2.1.116

推理降級：為降延遲付出的代價

3/4 Anthropic 將 Claude Code 的 reasoning effort 默認從 high 調整為 medium，目的是縮短回應延遲。但此變更使模型在程式碼推理與除錯任務上感覺「變笨」。4/7 回滾後，現在 Opus 4.7 默認 xhigh、其他模型維持 high。公司坦承：變更前內部評估未能偵測到此退化。

快取清理 bug：跨系統邊界的隱性錯誤

3/26 Anthropic 為閒置超過一小時的 session 導入 prompt caching 優化。原設計是「閒置滿一小時清一次 thinking 快取」，但實作上變成「閒置觸發後每一輪都清」，導致 Claude 在長 session 中表現「健忘、重複」，且每輪 cache miss 使用戶用量被快速消耗。Anthropic 指出此 bug「存在於 Claude Code 上下文管理、Anthropic API 與 extended thinking 三者的交集處」，牽涉多個系統邊界、是難以用單元測試捕捉的隱性錯誤。修復於 4/10 以 v2.1.101 發佈。

25 字簡潔指令：ablation 才發現智能下降 3%

4/16 Anthropic 加入一條系統指令：「工具呼叫間的文字輸出保持在 25 字以內」，本意是減少模型冗長解釋、讓體驗更乾淨。當下內部測試沒有發現退化，但經過更嚴謹的 ablation 對照實驗後，公司發現此指令對 Opus 4.6 與 4.7 兩個模型都造成約 3% 的整體智能下降。4/20 在 v2.1.116 回滾。此事件凸顯：系統 prompt 的微小措辭也可能對模型行為產生未預期的結構性影響。

影響範圍

產品層：Claude Code（三個問題皆受影響）、Claude Agent SDK（①②）、Claude Cowork（全部）

模型層：Sonnet 4.6、Opus 4.6、Opus 4.7

API 基礎設施：未受影響

用戶感受層面表現為：回應品質與「智能」感降低、延遲上升、conversation context 中途遺失、用量比預期燒得更快。

補償與流程改進

Anthropic 在 4/23 為所有訂閱者重置用量上限作為直接補償。同步承諾的流程改進包括：

對 system prompt 變更實施更廣的評估套件（evaluation suite）

改進 Code Review 工具提早偵測回歸

將內部測試標準化為公開 build，避免「內部版本」與「對外版本」行為分歧

為可能影響模型智能的變更加入 soak period 與漸進式 rollout

對使用者的啟示

對依賴 Claude Code 進行日常開發與研究的使用者而言，這份 postmortem 有三個可帶走的重點：第一，若你在 3 月中到 4 月 20 日間感受到 Claude 模型「變笨」、或是 Claude Code 對長 session 異常遺忘，那並非你的錯覺或 prompt 不當；第二，這段期間用量上限被快速吃光的用戶，可於 4/23 後確認 Anthropic 是否已自動重置；第三，即便是一條「25 字以內」的 prompt 微調，也可能對模型全域行為產生系統性影響——這是 LLM 產品工程的共通風險。

相較同業多以沉默或「這是使用者操作不當」回應模型退化質疑，Anthropic 這次的主動揭露與技術透明度，為 AI 產品事故檢討設下一個可參考的樣本。

這篇文章 Anthropic 自揭 Claude Code 三 bug 疊加：推理降級、快取遺忘、25 字指令反噬最早出現於鏈新聞 ABMedia。

免責聲明：本頁面資訊可能來自第三方，不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考，不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證，對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為，價格波動劇烈，您可能損失全部投資本金。請充分了解相關風險，並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明。

Vercel 資安外洩擴大至數百名使用者；AI 開發者風險更高

AI Agent AI 行業動態

Gate News 訊息，4 月 23 日 — Vercel 在 4 月 19 日披露，其安全事件最初被描述為影響「有限的一部分客戶」，現已擴展至更廣泛的開發者社群，特別是那些正在打造 AI 代理（AI agent）工作流程的人。此次攻擊可能影響數百名使用者

GateNews7分鐘前

OpenAI 推 GPT-5.5：12M 脈絡、AA 指數登頂、Terminal-Bench 82.7% 改寫代理基準

AI Agent AI 行業動態

OpenAI 公布 GPT-5.5，主打代理式工作與企業知識處理，並同步於 ChatGPT 與 Codex 推出。要點含 1200 萬 token 脈絡視窗、AA Intelligence Index 60，領先 Claude Opus 4.7、Gemini 3.1 Pro；價格為每百萬 token 輸入 5 美元、輸出 30 美元，輸出 token 減少約 40%，實際成本上升約 20%。

鏈新聞abmedia1小時前

Cluster Protocol 融資 $5M ，以加速 CodeXero：面向 EVM 的瀏覽器原生 AI IDE

AI 行業動態 AI 工具應用

Gate News 消息，4 月 23 日——AI 深科技與 Web3 基礎設施公司 Cluster Protocol 宣布，已在由 DAO5 領導的新一輪融資中籌集 $5 百萬資金，並獲 Paper Ventures、JPEG Trading 與 Mapleblock Capital 參與，使總融資額達到 7.75 百萬美元。資金將

GateNews1小時前

在供應鏈挑戰之際，Nvidia 於英國、中國及汽車領域擴大 AI 合作夥伴關係

股票 AI 行業動態

Gate News 消息，4月23日——儘管面臨來自 Google 的競爭以及供應鏈中斷，Nvidia 仍是 AI 硬體領域的主導者。TD Cowen 於週四重申對 Nvidia 的買入評級，稱其在性能方面的領先以及軟體生態系統的廣度。這項背書

GateNews1小時前

白宮指控中國「工業規模」盜取 AI 模型

AI 行業動態

美國白宮在 2026 年 4 月 23 日警告稱，根據 Michael Kratsios（助理）的一份備忘錄，外國實體（主要在中國）正在進行「工業規模」的行動，以複製美國的人工智慧模型。

Crypto Frontier5小時前

OpenClaw 2026.4.22 統一 Codex 與 Pi Harness 間的外掛生命週期，外掛載入時間最高降低 90%

PI 新聞 AI Agent AI 行業動態

Gate 新聞訊息，4月23日 — OpenClaw，一個開源 AI 代理平台，於 4月22日發布版本 2026.4.22；其最大的變更在於對 Codex harness 與 Pi harness 的生命週期進行對齊。此前，外掛在兩個 harness 路徑之間的行為不一致，且在某些環境中部分 hooks 會缺失

GateNews6小時前

留言

0/400

暫無留言