DeepSeek 創辦人梁文鋒在內部溝通中親口確認,新一代旗艦模型 V4 將於 4 月下旬正式發布。洩露規格顯示總引數量逼近 1 兆、支援 100 萬 tokens 上下文,更將完全執行於華為昇騰晶片,被視為中國 AI 突破輝達依賴的關鍵一步。
(前情提要:DeepSeek V4 拒絕輝達 找華為!阿里、位元組跳動、騰訊搶買昇騰950PR晶片)
(背景補充:DeepSeek 上線「專家模式」和「視覺模式」,V4 正式推出前最後暖身?)
據《新浪財經》引述知情人士消息,DeepSeek 創辦人梁文鋒已透露新一代旗艦大模型 DeepSeek V4 將於 4 月下旬正式亮相。官方雖尚未公布確切日期,但開發者社群已率先感受到暖身訊號:V4-Lite 變體正在 API 節點測試中,推理速度較上一代提升 30%,128K tokens 的上下文召回率達到 94%。
千億引數、百萬 token 視窗
根據目前流出的未官方確認資訊,V4 架構沿用 Mixture-of-Experts(MoE)設計,總引數量約 1 兆,但每個 token 實際啟用的引數僅約 370 億,在算力效率上維持 DeepSeek 一貫的「精算師」風格。
上下文視窗部分:V4 透過全新的 Engram 模組,有望支援 100 萬 tokens 的超長上下文,與當前頂尖模型較勁。Engram 的核心概念是條件記憶查詢,讓模型能以 O(1) 的複雜度存取知識,而非隨序列長度線性膨脹。
在能力面,洩露的基準測試顯示 HumanEval 達 90%、SWE-bench Verified 超過 80%,若資料屬實,也直逼現有主流旗艦模型。模態方面,V4 原生支援文字、圖片與影片輸入,定價則約 $0.30/MTok(輸入),延續 DeepSeek 低價策略。
完全跑在華為晶片上:最大的地緣政治訊號
技術規格之外,V4 最受外界關注的一點是硬體策略的徹底轉向:官方稱整個模型將完全執行於華為昇騰 950 PR 晶片,不依賴任何輝達 GPU。
這個決定的影響遠超 DeepSeek 本身。阿里巴巴、位元組跳動、騰訊已陸續大量採購華為次世代晶片,若 V4 成功驗證昇騰可以撐起頂級旗艦模型的訓練與推理需求,將是中國 AI 產業鏈在晶片自主化上迄今最具說服力的實戰案例。
美國對輝達出口的管制措施在這個脈絡下,反而可能成為加速中國自主生態系成熟的催化劑。

免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見
聲明。
相關文章
ChatGPT 廣告進軍澳紐加:Free 與 Go 用戶先行,付費方案維持無廣告
OpenAI於2023年4月17日擴展ChatGPT廣告至澳洲、紐西蘭及加拿大,針對Free與Go用戶,付費用戶無廣告。此舉標誌著AI商業化的第二條路徑,並考量了商業與監管風險,廣告出現可促進付費轉換。
鏈新聞abmedia1小時前
Hyundai Motor Group 以人工智慧與機器人為核心重組,目標 2030 年達到 30,000 台 Atlas 機器人
Hyundai Motor Group 正在重組,聚焦於人工智慧與機器人,並縮減傳統營運。該公司計劃在 2030 年前投資 343 億美元於機器人,並目標推出「機器人即服務」模式,與 Google DeepMind 及 NVIDIA 合作。
GateNews4小時前
NEA 探索在核能監管中使用人工智慧
NEA 新技術工作小組於 3 月 25--26 日召開了一場研討會,重點討論如何將人工智慧應用於核能主管機關的監管監督與內部營運。
摘要
NEA 研討會探討核能監管中的真實案例 AI 應用,並且
Cryptonews 7小時前
4月19日北京半程馬拉松將測試300+台人形機器人
北京第二屆機器人半程馬拉松將登場超過300台人形機器人,來自70支隊伍同場競技,賽程為21公里。活動著重展示自主移動方面的進展:其中40%能在不受控的情況下運作。儘管量產面臨挑戰,中國仍在自此人形機器人市場占據主導地位。
GateNews9小時前
美國尋求增加從納米比亞進口鈾,以供應由 AI 驅動的核電廠
美國正在考慮從納米比亞增加鈾進口,以支撐用於 AI 資料中心的核能供應,因為中國主導了納米比亞的鈾產業。隨著鈾價上漲,礦業興趣被重新點燃,儘管該乾旱地區的供水面臨挑戰。
GateNews9小時前
OpenAI 高層 Bill Peebles 與 Kevin Weil 在領導重整中離任
OpenAI 高層 Bill Peebles 與 Kevin Weil 宣布離職,這是公司在將營運去中心化之際一系列領導層變動的一部分。他們的離開是在數位其他備受矚目的高層相繼離任之後,同時也伴隨公司架構的調整。
GateNews11小時前