閘道消息,4 月 11 日,AI 基礎設施公司 Ramp Labs 發布研究成果「Latent Briefing」,透過直接壓縮大模型 KV 快取,實現多智能體系統之間的高效記憶共享;在不損失準確率的前提下,大幅降低 Token 消耗。在主流多智能體架構中,編排者(Orchestrator)將任務拆解並反覆呼叫工作者(Worker)模型,隨著推理鏈路不斷延伸,Token 用量呈指數級膨脹。Latent Briefing 的核心思路是借助注意力機制識別上下文中真正關鍵的部分,於表示層直接丟棄冗餘資訊,而非依賴速度慢的 LLM 摘要或穩定性差的 RAG 檢索。在 LongBench v2 基準測試中,該方法表現亮眼:Worker 模型 Token 消耗降低 65%,中等長度文件(32k 至 100k)的 Token 節省中位數達 49%,整體準確率較基線提升約 3 個百分點;而每次壓縮的額外耗時僅約 1.7 秒,較原始演算法提速約 20 倍。實驗以 Claude Sonnet 4 作為編排者、Qwen3-14B 作為工作者模型,涵蓋學術論文、法律文書、小說及政府報告等多種文件情境。研究還發現,最佳壓縮閾值會因任務難度與文件長度而異——難題適合採取激進壓縮以過濾投機性推理雜訊,長文件則更適合輕度壓縮以保留分散的關鍵資訊。
免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見
聲明。
相關文章
BeyondBlocks Asia 2026 會議定於 4 月 16-17 日在首爾舉行
BeyondBlocks Asia 2026 會議將於 4 月 16-17 日在首爾舉行,聚焦 AI、Web3、穩定幣和遊戲。它邀請了知名講者,並就區塊鏈與 AI 整合的未來進行討論。
GateNews42分鐘前
印度 Gupshup 推出 AI 代理 SuperAgent,用於多通道客戶對話
Gupshup 推出了 SuperAgent,一款用於在各種管道管理客戶對話的 AI。該公司也推出了 SuperClaw,供需要本地端資料儲存的企業使用。儘管估值下跌 80%,Gupshup 的營收仍在成長,而且在 AI 代理(agent)市場面臨激烈競爭。
GateNews1小時前
波士頓動力(Boston Dynamics)將 Google 的 Gemini AI 整合至 Spot 機器人,強化自主能力
波士頓動力(Boston Dynamics)展示了其配備 Google Gemini AI 的 Spot 機器人,讓其在整理與檢查等任務上具備更高的自主能力。整合 AI Vision Inspection 與 Learning 可提升 Spot 對環境數據的分析能力與作業效率。
GateNews2小時前
Wanted Lab 推出 Ennoia:面向組織層級 AX 市場的企業 AI 平台
Wanted Lab 正在推出 Ennoia,這是一個用於企業轉型的 AI 平台,讓所有員工都能在工作流程中使用 AI。該平台強調安全性,並整合先進的 AI 技術以提升功能。即將舉辦的研討會將進一步探討人力資源(HR)趨勢。
GateNews4小時前
Claude Code 推出 Routines:排程、API 觸發、事件驅動,AI 自動化不再需要開著電腦
Anthropic推出Claude Code的「Routines」功能,讓開發者可透過排程、API呼叫或Webhook事件觸發AI任務,自動運行於雲端,無需開機。Routines支援定時執行、API請求及監聽外部事件,旨在提升開發流程自動化,並整合現有功能,讓AI能無人值守地執行任務。
鏈新聞abmedia10小時前