DeepSeek 创办人梁文锋在内部沟通中亲口确认,新一代旗舰模型 V4 将于 4 月下旬正式发布。泄露规格显示总引参数量逼近 1 兆、支持 100 万 tokens 上下文,更将完全执行于华为昇腾晶片,被视为中国 AI 突破辉达依赖的关键一步。
(前情提要:DeepSeek V4 拒绝辉达 找华为!阿里、字节跳动、腾讯抢买昇腾950PR晶片)
(背景补充:DeepSeek 上线「专家模式」和「视觉模式」,V4 正式推出前最后暖身?)
据《新浪财经》引述知情人士消息,DeepSeek 创办人梁文锋已透露新一代旗舰大模型 DeepSeek V4 将于 4 月下旬正式亮相。官方虽尚未公布确切日期,但开发者社群已率先感受到暖身信号:V4-Lite 变体正在 API 节点测试中,推理速度较上一代提升 30%,128K tokens 的上下文召回率达到 94%。
千亿引参数、百万 token 窗口
根据目前流出的未官方确认信息,V4 架构沿用 Mixture-of-Experts(MoE)设计,总引参数量约 1 兆,但每个 token 实际启用的引参数仅约 370 亿,在算力效率上维持 DeepSeek 一贯的「精算师」风格。
上下文视窗部分:V4 通过全新的 Engram 模组,有望支援 100 万 tokens 的超长上下文,与当前顶尖模型较量。Engram 的核心概念是条件记忆查询,让模型能以 O(1) 的复杂度访问知识,而非随着序列长度线性膨胀。
在能力方面,泄露的基准测试显示 HumanEval 达 90%、SWE-bench Verified 超过 80%,若资料属实,也直逼现有主流旗舰模型。模态方面,V4 原生支援文字、图片与影片输入,定价则约 $0.30/MTok(输入),延续 DeepSeek 低价策略。
完全跑在华为晶片上:最大的地缘政治信号
技术规格之外,V4 最受外界关注的一点是硬件策略的彻底转向:官方称整个模型将完全执行于华为昇腾 950 PR 晶片,不依赖任何辉达 GPU。
这个决定的影响远超 DeepSeek 本身。阿里巴巴、字节跳动、腾讯已陆续大量采购华为次世代晶片,若 V4 成功验证昇腾可以支撑顶级旗舰模型的训练与推理需求,将是中国 AI 产业链在晶片自主化上迄今最具说服力的实战案例。
美国对辉达出口的管制措施在这个脉络下,反而可能成为加速中国自主生态系成熟的催化剂。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见
声明。
相关文章
以太坊联合创始人鲁宾:AI 将成为加密的关键转折点,但科技巨头的垄断带来系统性风险
以太坊联合创始人约瑟夫·鲁宾强调了人工智能对加密货币行业的变革潜力,同时提醒科技巨头之间的集中化所带来的风险。他设想在区块链上由人工智能驱动的自主交易,并指出传统金融与 DeFi 的融合正在加速。
GateNews48 分钟前
埃隆·马斯克推动“全民高收入”支票,称其为解决AI失业的终极方案
埃隆·马斯克主张推行“全民高收入”,以应对由人工智能引发的失业问题,并设想一个商品充足且零通胀的未来。相比之下,像萨姆·奥尔特曼这样的专家则担忧工作岗位流失,并提出为劳动者提供保护的措施。
Coinpedia57 分钟前
据称DeepSeek启动首轮对外募资,目标估值达100亿美元+并筹资3亿美元+
中国AI初创公司DeepSeek正在洽谈其首轮对外融资,目标是在$300 百万美元的融资额基础上,估值达到$10 十亿美元。尽管此前曾拒绝过投资邀约,但据报道称,其融资讨论目前已在进行中。
GateNews1小时前
ChatGPT 广告进军澳纽加:Free 与 Go 用户先行,付费方案维持无广告
OpenAI于2023年4月17日扩展ChatGPT广告至澳洲、 新西兰及加拿大,针对Free与Go用户,付费用户无广告。此举标志着AI商业化的第二条路径,并考量了商业与监管风险,广告出现可促进付费转化。
鏈新聞abmedia3小时前
现代汽车集团围绕人工智能与机器人进行重组,目标到2030年部署30,000台Atlas机器人
现代汽车集团正在重组,重点转向人工智能和机器人,并削减传统业务。该集团计划到2030年在机器人领域投入343亿美元,并旨在推出机器人即服务模式,与Google DeepMind和NVIDIA合作。
GateNews6小时前
NEA 探索在核监管中使用人工智能
NEA关于新技术的工作组于3月25日至26日召开了研讨会,重点探讨如何在核主管机构内部运营以及监管监督中应用人工智能。
摘要
NEA研讨会探讨了人工智能在核监管中的真实世界应用,其中包括
Cryptonews 9小时前