据 Beating 称,NVIDIA 已发布 Cosmos-Reason2-32B 的权重,这是其物理 AI 推理视觉语言模型(VLM)的旗舰版本,旨在帮助机器人和自动驾驶系统理解空间、时间和物理原理。该 320 亿参数模型基于 Qwen3-VL-32B-Instruct 构建,现已在 NVIDIA Open Model License 下提供商业使用。
该模型能够分析视频流以评估行车安全,在图像中以 2D/3D 坐标检测目标,并可作为人形机器人和自动驾驶车辆的规划引擎。与上一代相比,Cosmos-Reason2 新增了具有精确时间定位的目标检测,并将上下文窗口扩展至 256K tokens。
免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见
声明。
相关文章
Forefront Tech 完成 $100M IPO 定价,纳斯达克在代码 FTHAU 下上市
据 ChainCatcher 称,特殊目的收购公司 Forefront Tech 于 4 月 30 日完成 1 亿美元的 IPO 定价,并将在纳斯达克上市,股票代码为 FTHAU。该公司计划使用募集资金把握区块链、金融科技、人工智能方面的并购机会
GateNews5 分钟前
Anthropic Claude Code 因计费故障向用户多收 200.98 美元,最初拒绝退款,后才完成全额补偿
根据 Beating 的监控,Anthropic 的 Claude Code 服务中的一个计费漏洞导致一名 Max 20x 订阅者在仅使用其每月配额的 13% 的情况下,被额外多收了 200.98 美元的使用费。该漏洞是在用户的 git 仓库提交历史包含大写的情况下触发的
GateNews33 分钟前
DeepSeek 于 4 月 30 日推出视觉基础原语方法,以增强多模态推理
根据 DeepSeek 的技术报告,4 月 30 日,该公司推出了 Visual Primitives,这是一种将诸如点和边界框等基础视觉单元嵌入推理链的方法,以解决多模态任务中的 Reference Gap 问题。该方法降低了图像标记的消耗
GateNews58 分钟前
OpenAI 揭露 Codex 为何禁止谈论“哥布林”:书呆子人格奖励失控
OpenAI 在官方博客中说明 Codex 禁谈“哥布林”等生物,源于书呆子人格训练中的奖励信号偏好生物隐喻,导致跨人格污染与 RLHF 误导。事件由 Barron Roth 爆出系统指令后,OpenAI 采取短期硬编码与长期清除奖励信号两种策略,警示奖励设计的脆弱性,后续训练审计需更精细。
鏈新聞abmedia1小时前
阿里巴巴在 4 月 30 日开源 Qwen-Scope 可解释性模块,覆盖 7 个模型
据 PANews 称,4 月 30 日,阿里巴巴的 Qwen 公布了对 Qwen-Scope 的开源,这是一种在 Qwen3 和 Qwen3.5 系列模型上训练的可解释性模块。该发布覆盖了 7 个大型语言模型,包括密集版和混合专家(mixture-of-experts)变体,并提供 14 组稀疏自动编码器
GateNews2小时前
英伟达 B300 AI 服务器在供应紧张之际于中国创下 100 万美元
根据路透社,英伟达的 B300 AI 服务器现在在中国的售价约为 700 万元人民币(约 100 万美元),原因是打击走私网络的行动以及本地科技公司的持续需求。该价格已从 2025 年晚些时候约 400 万元人民币(585,000 美元)大幅上涨,显著
GateNews2小时前