當推理長度、Agent 調用鏈、長期記憶都在變長，真正決定體驗和成本的，不只是算力，而是“上下文能不能被高效讀寫、調度和復用”。這也是為什麼最近市場開始把注意力轉向 Context Memory、KV Cache、推理存儲分層這類基礎設施。
下一階段 AI 競爭，拼的可能不是誰會生成更多內容，而是誰能讓模型在更長任務裡，穩定、低成本地持續工作。
如果說訓練時代拼的是 GPU，那 Agent 時代，拼的就是 Memory。
這也是我在一個群裡跟群友討論為什麼龍蝦值得去玩，我說 Claude code 都是針對龍蝦去打的。但他們說全量上下文這個事情，我竟然無言以對，老老實實又認真養蝦。

查看原文

此頁面可能包含第三方內容，僅供參考（非陳述或保證），不應被視為 Gate 認可其觀點表述，也不得被視為財務或專業建議。詳見聲明。

1人按讚了這條動態

打賞
1
留言
轉發
分享

留言

請輸入留言內容

暫無留言

熱門話題
查看更多
#
WCTC交易賽瓜分800萬USDT
67.03萬熱度
#
Gate3月透明度報告
3.05萬熱度
#
高盛申請比特幣收益型ETF
76.68萬熱度
#
美軍封鎖霍爾木茲海峽
73.91萬熱度
#
Gate13週年
18.28萬熱度

大模型還在拼參數，但真正開始卡行業天花板的，已經變成了另一件事：上下文存儲。

熱門話題

WCTC交易賽瓜分800萬USDT

Gate3月透明度報告

高盛申請比特幣收益型ETF

美軍封鎖霍爾木茲海峽

Gate13週年

置頂