Ramp Labs пропонує нове рішення для спільного використання пам’яті між багатьма агентами, витрати токенів знижуються максимум на 65%

GateNews

Оновлення Gate News: 11 квітня компанія з інфраструктури для AI Ramp Labs опублікувала результати дослідження «Latent Briefing». Вона забезпечує ефективний обмін пам’яттю між багатосистемними агентами шляхом прямого стиснення KV-кешу великих мовних моделей, значно зменшуючи витрати на Token без втрати точності. У більшості поширених архітектур багатосистемних агентів оркестратор (Orchestrator) розкладає завдання на частини та неодноразово викликає модель робітника (Worker). У міру того, як ланцюжок міркувань постійно подовжується, обсяг Token стрімко зростає експоненційно. Ключова ідея Latent Briefing полягає в тому, щоб за допомогою механізму уваги визначити в контексті справді важливі фрагменти, а в шарі представлення прямо відкидати надлишкову інформацію, а не покладатися на повільні LLM-зведення або ненадійний RAG-пошук. У бенчмарку LongBench v2 цей підхід показав вражаючі результати: витрати Token у моделі Worker знизилися на 65%, а медіанна економія Token для документів середньої довжини (32k до 100k) досягла 49%. Загальна точність підвищилася приблизно на 3 відсоткові пункти порівняно з базовим рівнем, тоді як додатковий час на кожне стиснення становить лише близько 1,7 секунди, що прискорює роботу приблизно у 20 разів порівняно з початковим алгоритмом. Експерименти проводилися з Claude Sonnet 4 як оркестратором і Qwen3-14B як моделлю робітника, охоплюючи сценарії з документами різних типів, зокрема наукові статті, юридичні документи, романи та урядові звіти. Дослідження також виявило, що оптимальний поріг стиснення залежить від складності завдання та довжини документа: для складних задач підходить більш агресивне стиснення, щоб відфільтрувати шум спекулятивного міркування, а для довгих документів краще підходить м’яке стиснення, щоб зберегти розосереджену ключову інформацію.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

twin3.ai запускає тестову мережу Web 4.0 для «світлових» протоколів душі, реалізуючи ланцюгову цифрову ідентичність за допомогою 256-вимірного SBT

Twin3 14 квітня запустила інфраструктуру цифрової ідентичності, орієнтовану на економіку агентів, та вивела її на тестову мережу. Цей протокол через токени зі зв’язуванням душі зберігає ідентичність і досвід користувачів, формує цифрову ідентичність, підтримує персональні AI-агенти та сприяє автоматизованій економічній взаємодії.

GateNews3год тому

Дослідження Nous: глибокий розбір — децентралізована AI-лабораторія Paradigm, що ставить 1 млрд оцінки, Hermès-модель і мережа Psyche: повний розбір

Nous Research — це відкрита AI-лабораторія з відкритим вихідним кодом, яка спеціалізується на серії моделей Hermes. У 2025 році компанія отримала від Paradigm інвестиції в розмірі 50 млн доларів США та оцінила себе в 1 млрд. Її унікальність полягає в тому, що командою crypto native спочатку розробляються AI-технології, а потім вони інтегруються з блокчейном. Ключовий продукт — моделі Hermes — створено на основі ідеї зниження рівня відмов, а джерелами даних переважно є синтетичні дані. Паралельно Psyche Network будує децентралізовану AI-мережу для навчання на Solana, стимулюючи учасників через токенові механізми. Nous Research використовує стратегії відкритого коду та децентралізації, щоб продемонструвати свою технічну спроможність і життєздатність.

ChainNewsAbmedia17год тому

Byreal запускає on-chain AI трейдингового помічника RealClaw, підтримує розширення навичок від сторонніх розробників

Byreal 13 квітня запустила ончейн AI-торговельного асистента RealClaw; інструмент створено на основі фреймворка OpenClaw, він підтримує розширення навичок від сторонніх розробників, а користувачі можуть самостійно налаштовувати торгові стратегії. Наразі триває етап Alpha-тестування, і доступ надається лише запрошеним користувачам.

GateNews21год тому

Astriax отримує $50M інвестиції від Paradigm, щоб прискорити трейдинг, керований ШІ

Astriax отримала $50M інвестиції від Paradigm, позиціонуючи себе як лідера в AI-керованій on-chain торгівлі. Ця партнерська угода підвищує інституційну довіру в DeFi, зосереджуючись на автономному виконанні та розширеній аналітиці для оптимізації торгових стратегій і покращення управління ліквідністю.

BlockChainReporter22год тому

Появився відкритий AI-агент Hermes Agent, який має довготривалу пам’ять і може замінити OpenClaw

Nous Research випустила відкриту рамкову структуру AI Agent Hermes Agent із довготривалою пам’яттю на основі SQLite та самоеволюційною архітектурою, яка підтримує одним клацанням міграцію пам’яті та навичок OpenClaw. Процес встановлення включає дев’ять кроків, щоб безпеку можна було забезпечити виконанням у ізольованому середовищі через Docker. Крім того, Hermes Agent підтримує розгортання локальних моделей, що підходить користувачам, які приділяють особливу увагу конфіденційності даних.

MarketWhisper04-13 05:04
Прокоментувати
0/400
Немає коментарів