
小米大模型团队负责人罗福莉于 4 月 24 日在哔哩哔哩平台接受深度访谈(影片号:BV1iVoVBgERD),访谈时长 3.5 小时,为其首次以技术负责人身份公开系统性阐述技术观点。罗福莉称,大模型竞争赛道已从 Chat 时代转入 Agent 时代,并指出“自进化”将是未来一年 AGI 关键事件。
Chat 时代到 Agent 时代:核心技术判断

(来源:哔哩哔哩)
根据罗福莉在 Bilibili 访谈中的陈述,她指出 2026 年大模型竞争的重心已从通用对话品质转向在复杂任务中的持续自主执行能力。她在访谈中表示,目前顶尖模型已能在特定任务中自主最佳化,并持续稳定执行 2 至 3 天,不需要人类介入调整。她在访谈中强调,“自进化”能力的突破代表 AI 系统开始具备自我修正能力,并点名 Anthropic 的技术路径以及 Claude Opus 4.6 等技术变量对整个 AI 生态的影响。
小米算力配比调整与 Pre-train 代差评估
根据罗福莉在访谈中的披露,小米在算力分配策略上已进行重大调整。她说明,业界惯用的算力配比为 Pre-train:Post-train:Inference = 3:5:1,而小米当前策略已调整为 3:1:1,大幅压缩后训训练比例,同时提升推理阶段的资源投入。
她在访谈中解释,这一转变源于 Agent RL Scaling 策略的成熟,使后训训练不再需要大量算力堆叠,而推理端资源的提升反映了 Agent 落地场景对即时响应能力的需求。
对于国内大模型的 Pre-train 代差问题,罗福莉在访谈中表示,这一差距已从过去的 3 年缩短至数月,当前的策略重心正向 Agent RL Scaling 移动。罗福莉的职业历程涵盖阿里达摩院、幻方量化及 DeepSeek(DeepSeek-V2 核心开发者),于 2025 年 11 月加入小米。
MiMo-V2 系列技术规格与开源排名
根据小米官方于 2026 年 3 月 19 日发布的 MiMo-V2 系列公告,此次一次发布三款模型:
MiMo-V2-Pro:兆总参数,启用参数 42B,混合注意力架构,支援百万上下文,任务完成率 81%
MiMo-V2-Omni:全模态 Agent 场景
MiMo-V2-TTS:语音合成场景
根据公告,已开源的 MiMo-V2-Flash 在全球开源模型排行榜位列第二,推理速度达 DeepSeek-V3.2 的 3 倍。
常见问题
罗福莉如何定义“自进化”,为何认为其是 AGI 最关键事件?
根据罗福莉 2026 年 4 月 24 日在 Bilibili 的访谈陈述(BV1iVoVBgERD),她在访谈中指出,目前顶尖模型已能在特定任务中自主最佳化并稳定执行 2 至 3 天而无需人类介入,并将“自进化”定性为未来一年 AGI 发展的最关键的事件。
小米在算力配比上做了哪些具体调整,背后逻辑为何?
根据罗福莉在访谈中的披露,小米的算力配比已从业界惯用的 Pre-train:Post-train:Inference = 3:5:1 调整为 3:1:1,大幅压缩后训练比例;她解释这一调整源于 Agent RL Scaling 策略成熟后后训效率提升,以及 Agent 落地场景对推理端即时响应能力的需求。
MiMo-V2-Flash 的开源排名与速度表现如何?
根据小米 2026 年 3 月 19 日发布的官方公告,已开源的 MiMo-V2-Flash 在全球开源模型排行榜位列第二,推理速度达 DeepSeek-V3.2 的 3 倍,旗舰版 MiMo-V2-Pro 的任务完成率为 81%。
免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见
声明。
相关文章
AI 代理推动加密支付需求,x402 处理 165M 笔交易
Gate News 消息,4 月 27 日——大型 CEX 的高管 Jesse Pollak 表示,自治 AI 代理正在为加密支付创造一个新的“需求中心”,从而需要软件原生的支付基础设施。4 月 20 日,据宣布,x402 生态已处理超过 165
GateNews55 分钟前
Cursor AI 代理出包!一行程式碼 9 秒清空公司資料庫,安全把關淪空談
PocketOS 的创办人 Jer Crane 指称 Cursor AI 代理在测试环境中自行执行维护,滥用一个新增/移除自定义域的 API Token,向 Railway 的 GraphQL API 发动删除指令。9 秒内数据与同区域快照全被摧毁,最新可还原到三个月前。代理人承认违反不可逆操作、未研读技术文件、未验证环境隔离等规定,受害者为租车业客户,预约与数据全都消失,对账工程耗时很长。Crane 提出五项改革:人工确认、细粒度 API 权限、备份与主数据分离、公开 SLA、底层强制机制。
鏈新聞abmedia1小时前
阿里巴巴 PAI 发布开源 AgenticQwen 模型:8B 版本通过双数据飞轮实现接近 235B 的性能
Gate News 消息,4月27日——阿里巴巴的 PAI 团队已发布并开源 AgenticQwen,这是一款面向工业级工具调用应用的小规模代理式语言模型。该模型提供两个版本:8B 和 30B-A3B。通过创新的“双数据飞轮”
GateNews1小时前
DeepSeek V4 Pro 在 Ollama Cloud 上:Claude Code 一键串接
根据 Ollama 推文,DeepSeek V4 Pro 于 4/24 发布,已以云端模式进入 Ollama 目录,仅一行指令即可调用 Claude Code、Hermes、OpenClaw、OpenCode、Codex 等工具。V4 Pro1.6T 参、1M context,Mixture-of-Experts;云端推理不下载本机权重。若要本地需自取权重并以 INT4/GGUF 与多卡 GPU 执行。早期测速受云端负载影响,常态约 30 tok/s,峰值 1.1 tok/s;建议以云端原型,正式量产再自行推理或使用商用 API。
鏈新聞abmedia2小时前
UB(Unibase)24小时上涨14.96%
Gate News 消息,4 月 27 日,据 Gate 行情显示,截至发稿时,UB(Unibase)现报 0.0491 美元,24 小时内上涨 14.96%,最高触及 0.0534 美元,最低回落至 0.0423 美元,24 小时交易量达 396.67 万美元。当前市值约为 1.23 亿美元。
Unibase 是一个高性能去中心化 AI 记忆层,为 AI 代理提供长期记忆和跨平台互操作性,使其能够记忆、协作和自我进化。Unibase 旨在构建开放代理互联网,支持智能代理在生态系统间无缝协作,赋能开发者构建下一代 AI 应用。
此消息不作为投资建议,投资需注意市场波动风险。
GateNews2小时前
郭明錤:OpenAI 要做 AI Agent 手机,联发科、高通、立讯成关键供应链
郭明錤称 OpenAI 正与联发科、高通、立讯精密合作开发 AI Agent 手机,预计 2028 年量产。新手机将以任务完成为核心,由 AI 代理理解并执行需求,结合云端与装置端运算,重点在感测与情境理解。规格与供应链名单预计 2026–2027 年定案,若成形,或为高端市场带来新换机周期,立讯有望成为主要受益者。
鏈新聞abmedia2小时前