數據曝「Claude 降智」並非都市傳說,AI 模型不穩定成企業風險

鏈新聞abmedia

在 AI 成為企業標配工具之後,一個過去被視為「體感問題」的現象,正在快速浮上檯面:LLM(大型語言模型)正在「變笨」。網友 Wisely Chen 指出,所謂「LLM 降智」並非都市傳說,而是已能透過數據被持續追蹤,且正對企業工作流程造成實質影響。

他以自身經驗為例,4 月 15 日 Anthropic 旗下 Claude 系列服務出現全面降級,包含 claude.ai、API 與 Claude Code 均顯示「Degraded Performance」。這並非單純變慢或偶發錯誤,而是回應品質明顯崩盤,甚至出現無法正常使用的情況,導致其當日三個開發任務全數延誤。

這類情境對個人開發者而言或許只是效率下降,但對企業 IT 團隊來說,影響則被成倍放大。當一個團隊有多名工程師同時依賴 AI 工具進行 coding、文件撰寫與流程自動化,一次模型降級,意味著整體生產力在同一時間出現集體下滑,進而轉化為可觀的時間與成本損失。

AI 感覺變笨了?數據證實「早已降級」

Wisely Chen 指出,「GPT 變笨」、「Claude 不如以前」這類說法在社群流傳已久,但長期缺乏客觀數據支撐。直到近期出現持續監控模型品質的平台,這種現象才首次被量化。

其中,StupidMeter 對包括 OpenAI、Anthropic、Google 等主流模型進行 24 小時自動化測試,追蹤正確性、推理能力與穩定性等指標。與傳統一次性 benchmark 不同,這類系統更接近企業監控 API 或服務可用性的方式,觀察模型在實際使用環境中的表現波動。

數據結果相當直觀:目前多數主流模型均處於警告或降級狀態,僅少數模型維持正常。這意味著模型品質的不穩定,並非單一產品問題,而是整體產業的普遍現象。

LLM 偷降智,影響 AI 工作流企業穩定性

對企業而言,這樣的變化代表 AI 已從「提升效率的工具」,轉變為「影響穩定性的變數」。倘若企業日常工作流程從寫程式、做 code review,到產出文件與分析報告都已高度依賴 LLM。一旦模型在某一天出現推理能力下降、回答品質不穩,這些問題不會像傳統軟體 bug 一樣局部發生,而是會同時滲透進所有使用 AI 的環節。

更關鍵的是,這種波動往往難以預測,也難以即時察覺。多數企業並不具備持續監控模型品質的機制,通常是在產出結果異常、或團隊效率下降後,才意識到問題來自模型本身。在這樣的情境下,「降智」不再只是使用者的主觀感受,而是一種會直接影響企業營運節奏的系統性風險。

當 AI 成為水電,穩定性成為新的關鍵指標

Wisely Chen 將 LLM 的角色比喻為「現代企業的水電」。當 AI 已深入日常營運,成為不可或缺的基礎能力,其穩定性的重要性也隨之提升。

過去企業評估 AI 工具,多聚焦於模型能力、價格與功能,但隨著「降智」現象浮現,另一個更關鍵的指標正在浮現,那就是穩定性。當模型品質可能在未通知的情況下變動,企業不再只是「使用 AI」,要開始承擔一種新型態的基礎設施風險。更絕望的是,只看前沿的大型語言模型的話,基本上在算力問題未解決前,都可能會繼續發生。

這篇文章 數據曝「Claude 降智」並非都市傳說,AI 模型不穩定成企業風險 最早出現於 鏈新聞 ABMedia。

免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明

相關文章

Meta 股價上漲 1.73%,公司計劃自 5 月 20 日起裁減 8,000 個職位

Meta Platforms 計劃自 5 月 20 日起裁減約 8,000 個職位,約佔其員工規模的 10%,即使股價仍在上漲。該公司營收超過 $200 十億美元,正值重大重組之際,將重點放在 AI 投資上,並與產業中裁員的趨勢一致。

GateNews37分鐘前

Google年度報告稱Gemini實現毫秒攔截,阻擋99%詐騙廣告

文章討論了Google透過其生成式人工智慧系統Gemini加強廣告安全,報告顯示其攔截違規廣告的速度已縮短至毫秒,攔截率達99%。去年Google移除83億則廣告,並暫停2490萬個帳戶,顯示詐騙廣告數量大幅上升。專家指出,這是人工智慧與人工智慧間的對抗,未來仍需面對AI帶來的合法與非法行為的挑戰。

鏈新聞abmedia2小時前

以太坊聯合創始人盧賓:AI 將是加密的關鍵轉折點,但科技巨頭壟斷帶來系統性風險

以太坊聯合創始人約瑟夫·盧賓(Joseph Lubin)強調,AI 對加密貨幣產業具備改變格局的潛力,同時也提醒大型科技公司之間的集中化所帶來的風險。他設想區塊鏈上的由 AI 驅動的自主交易,並指出傳統金融與 DeFi 的融合正在加速。

GateNews4小時前

Elon Musk 推動「全民高收入」支票,作為 AI 失業的終極解決方案

Elon Musk主張「全民高收入」以因應由AI引發的失業問題,並展望一個物資充裕且零通膨的未來。相較之下,像是Sam Altman這樣的專家則對工作流失提出疑慮,並建議為勞工提供保護措施。

Coinpedia4小時前

據報導:DeepSeek推出首次對外募資輪,目標估值達100億美元以上及3億美元以上

DeepSeek,一家中國AI新創公司,正在洽談其首次對外融資輪,目標至少$300 百萬,估值達到$10 十億。儘管此前曾拒絕投資邀約,但據報導,其募資討論如今已在進行中。

GateNews5小時前

ChatGPT 廣告進軍澳紐加:Free 與 Go 用戶先行,付費方案維持無廣告

OpenAI於2023年4月17日擴展ChatGPT廣告至澳洲、紐西蘭及加拿大,針對Free與Go用戶,付費用戶無廣告。此舉標誌著AI商業化的第二條路徑,並考量了商業與監管風險,廣告出現可促進付費轉換。

鏈新聞abmedia7小時前
留言
0/400
暫無留言