Gate News 消息,4 月 11 日,AI 基础设施公司 Ramp Labs 发布研究成果「Latent Briefing」,通过直接压缩大模型 KV 缓存实现多智能体系统间的高效记忆共享,在不损失准确率的前提下大幅降低 Token 消耗。在主流多智能体架构中,编排者(Orchestrator)将任务拆解并反复调用工作者(Worker)模型,随着推理链路不断延伸,Token 用量呈指数级膨胀。Latent Briefing 的核心思路是借助注意力机制识别上下文中真正关键的部分,在表示层直接丢弃冗余信息,而非依赖速度慢的 LLM 摘要或稳定性差的 RAG 检索。在 LongBench v2 基准测试中,该方法表现亮眼:Worker 模型 Token 消耗降低 65%,中等长度文档(32k 至 100k)的 Token 节省中位数达 49%,整体准确率较基线提升约 3 个百分点,而每次压缩的额外耗时仅约 1.7 秒,较原始算法提速约 20 倍。实验以 Claude Sonnet 4 作为编排者、Qwen3-14B 作为工作者模型,覆盖学术论文、法律文书、小说及政府报告等多类文档场景。研究还发现,最优压缩阈值因任务难度和文档长度而异——难题适合激进压缩以过滤投机性推理噪声,长文档则更适合轻度压缩以保留分散的关键信息。
免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见
声明。
相关文章
Nous Research 深度解析:Paradigm 押注 10 億估值的去中心化 AI 實驗室,Hermes 模型與 Psyche 網路全面拆解
Nous Research 是一家开源 AI 实验室,专注于 Hermes 系列模型,并于 2025 年获得 Paradigm 投资 5,000 万美元,估值达到 10 亿。其独特之处在于由 crypto native 团队开发 AI 技术后再整合区块链。核心产品 Hermes 模型以降低拒绝率为设计理念,且数据来源以合成数据为主。同时,Psyche Network 在 Solana 上构建去中心化 AI 训练网络,通过代币机制激励参与者。Nous Research 采用开源与去中心化策略,旨在展示其技术实力及可行性。
鏈新聞abmedia11小时前
Byreal 推出链上 AI 交易助手 RealClaw,支持第三方技能扩展
Byreal于4月13日推出了链上AI交易助手RealClaw,该工具基于OpenClaw框架,支持第三方技能扩展,用户可自定义交易策略,目前处于Alpha测试阶段,仅向受邀用户开放。
GateNews15小时前
Astriax 从 Paradigm 获得 $50M 投资,以加速由 AI 驱动的交易
Astriax 已从 $50M Paradigm 获得投资,定位为 AI 驱动链上交易的领导者。该合作增强了 DeFi 中的机构信誉,重点在于自主执行和先进分析,以优化交易策略并改进流动性管理。
Block Chain Reporter16小时前
开源 AI 代理 Hermes Agent 问世,具备长期记忆可取代 OpenClaw
Nous Research 发布开源 AI Agent 框架 Hermes Agent,具备基于 SQLite 的长期记忆机制和自我进化架构,支持一键迁移 OpenClaw 的记忆与技能。安装过程包含九个步骤,确保安全性可通过 Docker 隔离环境执行。此外,Hermes Agent 支持本地模型部署,适合重视数据隐私的用户。
Market Whisper22小时前
Aethir Claw 使 AI 代理能够执行创造性工作流
Aethir Claw 是一个去中心化的 GPU 云平台,使自主的设计师 AI 代理能够用于内容创作,从根本上改变 AI 在无需人工提示的情况下生成视觉效果与媒体的方式。它提升了数字化制作过程中的可扩展性、自动化和创造力。
Block Chain Reporter23小时前