OpenAI 工程师 Clive Chan 挑战 V4 硬件建议,称其相较 V3 存在错误与模糊之处

Gate News 消息,4 月 24 日——OpenAI 工程师 Clive Chan 就 V4 技术报告中的硬件建议章节提出了详细异议,称其“出人意料地平庸且容易出错”,与备受赞誉的 V3 版本相比尤为如此。V3 的硬件指导,其中包括问答(Q&A)环节,这些环节成为 ISCA 学术会议上最受欢迎的讨论话题,并提供了与业界互连标准相匹配的具体建议。相比之下,V4 则要模糊得多。

Chan 系统性地质疑了三项关键建议。关于功耗,报告指出,软件优化允许芯片在同一时间以满负荷运行计算、存储与通信,并建议芯片制造商预留更多的功率余量。Chan 认为这适得其反:芯片的总功耗受物理工艺限制所约束,因此预留更大的功耗裕量只会降低工作频率,最终减少计算性能。关于 GPU 到 GPU 的数据传输,报告主张采用拉取(pull)模型——由 GPU 主动获取数据——而非推送(push)模型,并称在推送操作中存在较高的通知开销。Chan 则对此提出异议,认为拉取实际上更慢,并且更优的是提升网络适配器能力。然而,这两者可能在讨论问题的不同层面:报告谈的是通知机制的开销,而 Chan 指的是传输延迟本身。

关于激活函数,报告建议用更简单的函数来替换 SwiGLU,以降低计算负担。Chan 认为这没有任何价值,并指出 Sonic MoE 已经通过使用 SwiGLU 展示了最佳性能。Chan 怀疑 DeepSeek 可能“故意削弱了这一部分。”

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明

相关文章

Cohere 收购德国 AI 公司 Aleph Alpha,斩获 $600M 投资用于欧洲扩张

Gate 新闻消息,4月24日——加拿大 AI 公司 Cohere 宣布计划收购德国 AI 公司 Aleph Alpha,以加强其在欧洲的布局。Aleph Alpha 的支持方 Schwarz Group 计划在 Cohere 的 E 轮融资中投资 $600 百万。 预计该融资轮将于 202

GateNews13 分钟前

小鹏、Redmi 牵头:北京车展上的车载 AI 推进

快讯,4月24日——随着中国加速推进 AI Plus 战略,并寻求在国外半导体方面获得更大独立性,中国车企在4月24日的北京车展上展示了先进的车载 AI 系统。 小鹏展示了语音控制泊车功能,允许驾驶员“通过

GateNews53 分钟前

前字节跳动 Seed 工程师:字节跳动 AI 迭代需六个月,而谷歌为三个月

Gate News 消息,4 月 24 日——字节跳动 Seed 团队的前工程师、现任北京大学助理教授张驰在播客《Into Asia》中透露,字节跳动完成一次完整的大型语言模型训练 (预训练循环大约需要六个月

GateNews1小时前

Naver 推出 AI Tab 测试版,Google Gemini 进入韩国搜索市场

Gate News 消息,4 月 24 日——Naver 宣布,其新的对话式搜索功能 AI Tab 将启动封闭测试版,此前谷歌已在韩国于 Chrome 中推出 Gemini。 AI Tab 将与 Naver 现有的搜索标签并列出现,为用户提供一个专门用于对话式

GateNews1小时前

印度AI工程招聘激增59.5%,扩展至科技枢纽之外

LinkedIn 的《AI 劳动力市场报告 2026》于 4 月 24 日发布,发现印度的 AI 工程招聘同比增长 59.5%,在该平台研究的各市场中呈现出最快的增长速度。 这种增长由需求扩散至既有技术中心之外所推动。包括以下城市在内

Crypto Frontier2小时前

联邦银行在 AI 扩张之际裁员 120 人

澳大利亚联邦银行宣布,将在该国最大银行审查岗位并扩大其对人工智能的使用过程中,裁减约120个岗位,路透社称。裁员包括在西澳大利亚的Bankwest裁减43个岗位,其中有6个岗位将被自动化影响。此次裁员涉及的影响还

Crypto Frontier2小时前
评论
0/400
暂无评论