打破週期性迷思!一公式拆解 HBM 需求結構:記憶體為何只會繼續上漲?

鏈新聞abmedia

AI 浪潮推動記憶體需求與價格水漲船高,然而外界仍擔憂 HBM 是否會重蹈「週期性」覆徹,像過去的 DRAM 一樣,在需求高峰後迅速反轉?半導體架構分析人士 fin 對此指出,HBM 的需求邏輯,已與傳統記憶體產業規律脫鉤,正透過 token 重新定價。

(記憶體漲勢趨緩?機構評估 Q2 漲幅縮窄至 30%,下半年進一步降溫)

CPU 時代的記憶體:可有可無的附屬品

fin 指出,在 CPU 主導運算的年代,DDR 記憶體的角色始終只是輔助角色。CPU 工程師發展出一整套掩蓋記憶體延遲的架構技巧,包括超純量設計、多層快取、暫存器重新命名等,讓處理器得以在不倚賴高速記憶體的條件下維持高效能:

工業界的經驗法則是,即便 DDR 頻寬直接翻倍,CPU 整體效能的提升也往往不超過兩成。

這樣的架構直接塑造了過去數十年 DRAM 產業的成長節奏。DDR3 到 DDR5,歷時整整十五年;過去十年間,一般 PC 的 DDR 容量從 7 至 8 GB 增長至約 23 GB,十年僅成長三倍。DRAM 廠商的主要獲利來源為容量大小,頻寬升級不過是拉高單位售價的手段。

在 CPU 時代,記憶體就是晶片產業裡邊際效用最低的一環,週期性起伏是常態、也是宿命。

AI 推理時代來臨,從根本改寫記憶體價值標準

然而,當運算主角切換至 AI 推理引擎,衡量標準也隨之更迭,晶片廠商比的是每秒能執行多少次浮點運算;如今,AI 時代的核心 KPI 只有一個:每單位成本與每單位功耗,能夠產生多少個 Token。

輝達執行長黃仁勳所提出的「AI 工廠」概念,精確描述了這套新邏輯:AI 工廠存在的意義,就是以最低成本生產最多 Token,同時把 Token 的輸出速度推向極限。優化目標由單一維度向外擴展,需同時最大化 Token 的總吞吐量,也追求每個請求的 Token 輸出速度。

這個 KPI 的改變,則成了 HBM 命運翻轉的起點。

Token 吞吐量公式,揭開 HBM 需求的第一性原理

fin 將 AI 推理的 Token 吞吐量,拆解為兩個參數的乘積:「同時處理的請求批次數量 × 每個請求的平均 Token 生成速度」追溯這兩個參數各自的瓶頸,答案都指向同一個零件。

批次數量的瓶頸,在於 HBM 的儲存容量。每一個推理請求都攜帶著自己的 KV 快取,也就是模型推理過程中儲存中間狀態的機制,而這份快取必須即時存放在 HBM 之中,以便模型每生成一個 Token 時反覆高速讀取。批次規模越大,HBM 所需的儲存空間就越大,兩者呈線性正比關係。

Token 速度的瓶頸,則在於 HBM 的頻寬。模型解碼階段每產生一個 Token,都需要反覆讀取龐大的啟動權重與 KV 快取,讀取速度直接決定了 Token 的生成效率,而讀取速度的上限,就是 HBM 的頻寬。

他表示,這個關係可以用機場接駁車做比喻:HBM 容量是接駁車的車廂大小,決定一次能載多少乘客;HBM 頻寬是車門的寬度,決定乘客上下車的速度;旅客輸送的總吞吐量,則是車廂大小乘以上車速度的積。由此推導出 AI 推理硬體需求的第一原則:

Token 吞吐量 = HBM 容量 × HBM 頻寬

若要讓每一代 GPU 的 Token 吞吐量維持兩倍的世代成長,HBM 容量與 HBM 頻寬的乘積就必須每代翻倍。

軟體優化解不了題,HBM 需求鎖定在指數軌道上

面對這套推論,市場最常見的反駁是:軟體優化難道不能降低對 HBM 的依賴?他給出的答案是,軟體效率與硬體規格的進步是兩個完全獨立的維度,兩者並不互相取代。這就像 CPU 軟體優化再徹底,仍無法阻止英特爾或 AMD 每一代都必須在標準測試中交出更高的跑分,否則產品就賣不出去。

GPU 的邏輯完全相同:只要全球對 Token 的需求持續擴張,對更高 Token 吞吐量的追求就不會停歇,對 HBM 兩方面進步的需求更不會停止。

更關鍵的是,這股壓力並非來自外部景氣的拉動,而是供應端的內生需求。只要輝達還要販賣下一代 GPU,就必然要向 SK 海力士、三星、美光施壓,要求每一代 HBM 在容量與頻寬上同步躍進,因為 HBM 的天花板,就是 GPU 效能的天花板。

將輝達從 A100 到 Rubin Ultra 各代 GPU 的 Token 吞吐量,與對應的「HBM 容量 × HBM 頻寬」數值繪於同一對數座標圖上,兩條曲線的吻合程度將令人驚訝。這並非歷史巧合,而是系統最佳化的必然解。

HBM 告別週期宿命,市場定價邏輯仍待重估

綜合上述架構層面的推導,HBM 與傳統 DRAM 的本質差異已然清晰。傳統記憶體是晶片產業的附屬品,需求驅動力薄弱,一旦擴產節奏超越需求復甦,週期性崩價便如期而至。

但 HBM 的需求,已被 AI 推理架構的物理邏輯鎖定在指數成長的軌道之上。這與 AI 整體市場的冷熱與總體經濟的景氣循環,都不存在直接的因果關係。

當然,真正的問題並不在需求端,而在供應端:SK 海力士、三星與美光這三大玩家,在面對強勁需求時,能否克制過去幾十年間反覆上演的盲目擴產衝動,避免再度埋下供過於求的週期禍根?這個問題的答案將會是本輪記憶體週期,能否長期延續的關鍵變數。

(記憶體股崩跌還能買嗎?三星證券分析師:週期內修正而非景氣見頂)

這篇文章 打破週期性迷思!一公式拆解 HBM 需求結構:記憶體為何只會繼續上漲? 最早出現於 鏈新聞 ABMedia。

免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明

相關文章

摩根士丹利將標普 500 獲利預測上調至 4%,因科技業獲利強勁

根據摩根士丹利策略師 Michael Wilson 在 5 月 4 日的說法,美國強勁的企業獲利,特別是來自科技產業,正在抵消人們對中東衝突可能影響股市的擔憂。Michael Wilson 的團隊表示,S&P 500 的獲利預期已在全盤調升

GateNews1小時前

GameStop 對 eBay 出價 $56B ,利用 $519M 比特幣金庫

GameStop 已提出一筆未經邀請的 555 億美元收購要約以併購 eBay,由一份 200 億美元的銀行承諾作為背書,並附帶一個 5.19 億美元的比特幣金庫,該金庫由執行長 Ryan Cohen 在 2025 財年期間悄悄建立。 重點整理: GameStop 提出

Coinpedia1小時前

金融專家解釋為何股市即將崩盤,加密貨幣是否反而可能迎來反彈?

金融專家解釋為什麼股市即將崩盤。 他深入說明聯準會可能如何回應,以及如何最好地應對。 會不會改由加密貨幣價格上漲行情來發生? 一位知名的金融專家解釋為什麼股市今年某個時候將會走向崩盤,

Crypto News Land1小時前

輝達挑戰者 Cerebras 擬以 400 億估值上市,背後仍是台積電 5 奈米

Cerebras 將於納斯達克上市,估值約400億、募資上限40億,發行價115–125美元。以晶圓級處理器WSE為核心,定位AI基礎建設平台,客戶含OpenAI、AWS,TSMC為關鍵代工。2025年營收5.1億但虧損,依賴G42與MBZUAI等少數大客戶;OpenAI將部署750MW低延遲算力,AWS Bedrock也有合作。

鏈新聞abmedia2小時前

三圓眼 $1B 香港 IPO 在中國批准後

根據路透社報導,潮州三圈集團已就香港上市提出申請,目標是在中國獲得監管批准後籌集最高 10 億美元。總部位於廣東的陶瓷元件製造商於 2025 年 12 月提交其招股說明書草案,並計劃將所得款項用於

Crypto Frontier2小時前

Cerebras 計畫 $4B 在 Nasdaq 進行 IPO,並於 5 月 4 日開始路演,每股定價區間為 115-125 美元

根據路透社,AI 晶片製造商 Cerebras Systems 於 5 月 4 日啟動其 IPO 路演,計畫在 Nasdaq 以代號 CBRS 上市。該公司計劃將股價定在 115 美元至 125 美元之間,並可能以約 400 億美元的估值最多籌集至多 0$4 十億美元。這標誌著 Cerebras 的第二

GateNews2小時前
留言
0/400
暫無留言