為什麼有人覺得 AI 改變世界、有人覺得普通?Karpathy 的兩個診斷

鏈新聞abmedia

OpenAI 創辦團隊成員、Tesla 前 AI 總監 Andrej Karpathy 在 X 上發表「AI 能力認知差距」長文、回應一個社群現象:對 AI 的驚嘆程度兩極分化—一群人覺得 AI 已經改寫世界、另一群人覺得 AI 只會幻覺、無聊、被吹過頭。Karpathy 提出兩個診斷、解釋為什麼這兩群人是「平行世界」、彼此誤解了對方的判斷依據。本文整理他的論述、與對台灣科技讀者的啟示。

診斷一:你用的是哪一年、哪一層的 AI?

Karpathy 的第一個觀察直接、犀利:「很多人去年試了 ChatGPT 的免費版、就讓那次體驗主導他們對 AI 的看法。」這群人的反應通常是嘲笑模型的奇怪反應、幻覺、笨拙、轉發 OpenAI 進階語音模式被「我該開車去洗車還是走路」這種簡單問題搞砸的影片。

但 Karpathy 指出:這些「免費版、舊版、棄用版」的模型、根本不能反映 2026 年最先進 agentic 模型(特別是 OpenAI Codex 與 Claude Code)的能力。簡單說:你拿 2024 年的免費 ChatGPT 來判斷 AI 能不能寫程式、就像拿 2008 年的 Nokia E71 來判斷智慧型手機能不能用。

對許多台灣讀者而言這也是現實—訂 ChatGPT Plus($20)尚算普遍、但訂 ChatGPT Pro($200)、Claude Max($100)的人非常少數。沒在最先進付費 tier 上跑過 agent task 的人、看 AI 大多是「玩具好玩但不可靠」;跑過的人、看 AI 是「完整改寫工作流程」。同一個技術、兩個世界。

診斷二:能力進步在不同領域是「不對稱」的

Karpathy 的第二個診斷更有意思:「就算你付 $200/月用最先進模型、能力的進步也是『尖峰式』、集中在高度技術領域。」

他指出:搜尋、寫作、建議這類「典型查詢」、不是過去這年 AI 進步最劇烈的領域。原因有兩層:

強化學習(RL)依賴可驗證的獎勵函數—寫程式有「單元測試通過了嗎」這種明確訊號、寫作沒有對應的客觀判準、所以 RL 訓練的進步速度差距很大

OpenAI、Anthropic 等公司的最大商業價值在 B2B 程式碼/研究/工程場景、所以資源、人力、優先序都集中在這些領域、其他用例不是最大利潤來源

這個觀察很關鍵—它解釋了「為什麼 AI 寫程式能力突飛猛進、但 AI 寫文章還是常常很普通」這個多人困惑的現象。不是 AI 公司不會做、而是他們的金礦在別處、注意力跟著去了。

誰最受「AI 認知衝擊」?兩個條件齊備的人

把兩個診斷結合、Karpathy 描述「最會被 AI 認知衝擊」的群體—同時滿足兩個條件的人:

付費使用最先進的 agentic 模型(OpenAI Codex、Claude Code)

在高度技術領域(程式設計、數學、研究)專業使用

這群人最受所謂「AI Psychosis」影響—Karpathy 用語、形容當你親眼看到 LLM 把原本要花幾天到幾週的程式問題在幾小時內解決、那種對 AI 能力與斜率(slope)的判斷、會讓你對未來幾年的科技格局有截然不同的看法。

對另一群人(沒付費、沒在技術領域用)、這種說法聽起來像「過度興奮」、像「矽谷小圈圈的群體迷思」。但 Karpathy 認為這不是迷思、而是親身體驗的真實判斷。

兩群人「對著彼此的世界發言」

Karpathy 的核心結論:「這兩群人在彼此說話、不在跟對方說話。」他描述同時可能成立的兩件事:

OpenAI 免費(且我認為被半放棄的)「進階語音模式」、在 Instagram Reels 上會搞砸最笨的問題

同一時間、OpenAI 最高 tier 付費的 Codex 模型、會花 1 小時連貫地重構整個 codebase、或找出並利用電腦系統的漏洞

兩件事都是真的、不衝突。但兩群人各自只看到一邊、然後互相覺得對方「過度興奮」或「太無知」。Karpathy 寫這篇文的目的、就是想橋接這個落差。

給台灣讀者的啟示:你站在哪一群?

Karpathy 的論述對台灣讀者特別有意義、因為台灣科技論述場上同樣有兩極分化:一邊是「AI 已經接管」、一邊是「不過是 chatbot 而已」。判斷自己屬於哪群、可以看 3 個自我問題:

你最近一次親自下 prompt 給最先進付費模型(GPT-5.5 Pro、Claude Opus 4.7)是多久前?

你有沒有讓 agent 跑超過 30 分鐘、實際完成一個生產級任務(重構程式、寫研究綜述、debug 複雜系統)?

你判斷 AI 能力的依據、來自媒體報導、社群迷因、還是親身使用?

三個問題都答「有、近期、親身使用」的人、會落在 Karpathy 描述的第二群、會比較理解他「AI Psychosis」的說法。三個問題都答「沒、很久前、媒體上看的」的人、會落在第一群、可能對 AI 進步的速度大幅低估。

這不是說哪一群「對」、而是不同群體的判斷依據根本性差異。當你看到下一篇「AI 是泡沫」或「AI 將取代所有工作」的文章、先確認作者落在哪一群、再決定怎麼讀。

Karpathy 的「OpenClaw 時刻」補充

Karpathy 在後續貼文補充:「有人最近告訴我、OpenClaw 時刻之所以這麼大、是因為這是非技術背景的大群人、第一次親身體驗最先進的 agentic 模型。」這個觀察說明:認知差距不只是「程度」差距、也是「親身體驗 vs 道聽塗說」的差距。

對 abmedia 讀者而言、最實用的解法是:拿出 $20、訂一個月 ChatGPT Plus 或 Claude Pro、找一個你自己關心的真實任務(寫一篇研究報告、整理一份財務分析、debug 一個程式專案)、用 agent 完整跑一次、再回來判斷 AI 對你的工作意義。比讀 100 篇 AI 報導都有用。

這篇文章 為什麼有人覺得 AI 改變世界、有人覺得普通?Karpathy 的兩個診斷 最早出現於 鏈新聞 ABMedia。

免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明

相關文章

R0AR 進入 Consensus 2026 PitchFest 決賽,僅差進入前 20 名

根據 MetaversePost,R0AR 於 5 月 4 日晉級 CoinDesk「Consensus 2026 PitchFest」的最後遴選輪次,僅差一點就進入入選進行現場簡報的前 20 家新創公司。這位 Web3 和 AI 領域的創新者與全球其他高潛力新創公司一同被評估於產業的其中一個主要活動場景中。

GateNews1小時前

馬斯克在開庭前向 OpenAI 尋求 1500 億美元和解金,和解談判破裂

根據一份法院文件,Elon Musk 在 4 月 26 日聯繫了 OpenAI 總裁 Greg Brockman,時間是在他們的審判於奧克蘭聯邦法院開庭的兩天前,目的是探討和解。當 Brockman 建議雙方都撤回他們的主張時,Musk 回覆了威脅,對 Brockman 說:「到結束時

GateNews1小時前

Cursor 接受 SpaceX 的 600 億美元收購要約,但不願在代碼模型上與 xAI 合作

根據 The Information,Cursor 已接受來自 SpaceX 的一項有條件 600 億美元收購要約,儘管該交易尚未完成。該公司目前沒有計劃與 SpaceX 的 AI 部門 xAI 合作開發程式碼模型。相反地,Cursor 正在專注於對其進行優化

GateNews1小時前

Haun Ventures 於 5 月 4 日關閉 10 億美元基金,並在早期與晚期加密投資之間分配資本

根據彭博社,Haun Ventures 於 5 月 4 日完成了一輪 10 億美元的募資,當中 5 億美元用於早期投資,另 5 億美元用於後期投資。該基金將在未來兩到三年內部署資金,目標是加密貨幣與區塊鏈新創,同時擴展

GateNews2小時前

OpenAI 為部署合資企業籌集 $4 十億美元,估值 100 億美元

根據 BlockBeats,5 月 4 日,OpenAI 融資規模超過 $4 billion,以成立一家新的合資企業,專注於協助企業採用其人工智慧軟體。該合資企業名為 The Deployment Company,獲 19 位投資者支持,其中包括 TPG Inc.、Brookfield Asset Management、

GateNews3小時前

Applied Digital 取得 3 億美元橋接融資,由高盛牽頭,用於 AI 資料中心

根據 Globenewswire,Applied Digital 於 5 月 4 日透過由 Goldman Sachs 領導的優先有擔保橋式融資取得 3 億美元,以推進其 AI 資料中心開發。該融資以專案資產作為擔保,且可不受罰金提前償還,該公司計劃繼續推進

GateNews3小時前
留言
0/400
暫無留言