✍️ Gate 廣場「創作者認證激勵計劃」進行中!
我們歡迎優質創作者積極創作,申請認證
贏取豪華代幣獎池、Gate 精美周邊、流量曝光等超過 $10,000+ 豐厚獎勵!
立即報名 👉 https://www.gate.com/questionnaire/7159
📕 認證申請步驟:
1️⃣ App 首頁底部進入【廣場】 → 點擊右上角頭像進入個人主頁
2️⃣ 點擊頭像右下角【申請認證】進入認證頁面,等待審核
讓優質內容被更多人看到,一起共建創作者社區!
活動詳情:https://www.gate.com/announcements/article/47889
我注意到我們評估現代語言模型時存在一個有趣的悖論。它們聽起來令人信服,回答自信,生成大量文本。但問題在於——流暢的語言並不等同於理解。自信並不代表對現實的感知。
如果深入根本問題,就會發現這是一個相當古老的故事。還記得柏拉圖的洞穴嗎?囚徒被鎖鏈束縛,只能看到牆上的影子,並將其當作現實,因為他們一無所知。現在我們創造的語言模型也正處於同樣的情境。
這些系統看不到世界。它們聽不到、觸摸不到、感受不到。它們所知道的只有文本。書籍、文章、帖子、評論、轉錄。文本是它們進入世界的唯一入口。而文本本身並非現實,而是人類對現實的描述。這些描述不完整、偏見重重、經常扭曲。在網路和書籍中既有天才的洞見,也有明顯的謊言、宣傳和陰謀論。語言模型在這一切之上進行訓練。它們只看到人們投射到牆上的影子。
多年來,人們認為規模能解決一切。更多數據、更強大的模型、更高的參數——問題就會消失。但事實並非如此。牆上的影子越多,並不代表現實就存在。語言模型擅長預測統計上可能出現的下一個詞,但它們不理解因果關係、物理限制或行動的真實後果。這也是為什麼幻覺不僅僅是可以修復的錯誤,它是一個架構的結構性缺陷。
正因如此,越來越多的注意力轉向全球模型。這些系統構建內部表示,理解流程的運作方式,通過交互學習,模擬行動前的結果。它們不再只問“下一個詞是什麼?”,而是問“如果我們這樣做,會發生什麼?”。全球模型不僅局限於文本。它們可以處理時間序列、感測數據、反饋、表格和模擬。
實際操作中,情況是這樣的。在物流中,語言模型可以撰寫故障報告,而全球模型則可以模擬港口封閉或燃料價格飆升如何在整個供應鏈中傳播。在保險和風險管理中,文本系統解釋政策,但全球模型研究風險如何演變,模擬極端事件,評估連鎖損失。工廠的數字雙胞胎已經是早期版本的全球模型。它們不僅描述生產,更模擬機器、材料和時間的交互。
在所有這些情況下,語言是有用的,但遠遠不夠。需要一個系統實際運作方式的模型,而不僅僅是人們談論它的描述。
從語言模型轉向全球模型,並不是放棄前者,而是正確的定位。在下一階段,語言模型將成為界面和輔助駕駛。全球模型將提供基礎、預測和規劃。語言將建立在學習現實的系統之上。
在柏拉圖的比喻中,囚徒並不是通過更仔細地研究影子而獲得解放,而是當他們轉身看到這些影子的來源,然後走出洞穴,進入真實世界。人工智慧正接近這樣的時刻。早早理解這一點的公司,將不再將令人信服的語言誤認為理解,而是開始構建模擬自身現實的架構。不是能漂亮描述世界的AI,而是真正理解其運作方式的AI。