"MOE"的搜索结果
2026-03-26
01:51

美团开源LongCat-Next:3B参数统一视觉理解、生成与语音

美团龙猫团队开源的 LongCat-Next 是一款基于 MoE 架构的多模态模型,整合了文本、视觉理解、图像生成、语音等五种能力。其核心设计 DiNA 通过离散 token 实现统一任务处理,视觉方面采用的 dNaViT 使图像生成表现出色。与同类模型比较,LongCat-Next 的各项基准表现领先,显示出其在多模态理解与生成领域的优势。
展开
02:27

美团开源560B参数定理证明模型,72次推理通过率97.1%刷新开源SOTA

美团LongCat团队于3月21日开源了LongCat-Flash-Prover,一个5600亿参数的MoE模型,专注于Lean4形式化定理证明。模型分为自动形式化、草图生成和完整证明生成三项能力,结合推理工具与Lean4编译器实现实时验证。训练采用Hybrid-Experts Iteration Framework和HisPO算法,防止奖励作弊。基准测试表明,该模型在自动形式化和定理证明方面刷新了开源权重模型的记录。
展开