Ramp Labs выдвигает новое решение для совместного использования памяти мультиагентами, при этом расход токенов снижается максимум на 65%

GateNews

2026-04-11 05:14:49

Новости Gate News: 11 апреля компания по инфраструктуре ИИ Ramp Labs опубликовала результаты исследования «Latent Briefing». Они достигаются за счет прямого сжатия KV-кэша больших языковых моделей для эффективного обмена памятью между многоагентными системами — при этом точность не снижается, а потребление токенов существенно уменьшается. В большинстве распространенных архитектур многоагентных систем оркестратор (Orchestrator) разбивает задачу и многократно вызывает модели рабочих (Worker). По мере того как цепочка рассуждений постоянно удлиняется, количество токенов растет экспоненциально. Ключевая идея Latent Briefing — использовать механизм внимания, чтобы выявлять в контексте действительно важные части, а на уровне представлений напрямую отбрасывать избыточную информацию, а не полагаться на LLM-сводки, которые работают медленно, или на RAG-поиск, который отличается нестабильностью. На бенчмарке LongBench v2 этот подход показал впечатляющие результаты: потребление токенов у модели Worker снизилось на 65%, для документов средней длины (от 32k до 100k) медианный объем сэкономленных токенов составил 49%, общая точность относительно базовой линии выросла примерно на 3 процентных пункта, при этом дополнительное время на каждое сжатие — лишь около 1,7 секунды, что ускоряет исходный алгоритм примерно в 20 раз. Эксперименты проводились с Claude Sonnet 4 в роли оркестратора и Qwen3-14B в роли модели рабочего, охватывая разнообразные сценарии документов, включая научные статьи, юридические документы, романы и правительственные отчеты. Исследование также выявило, что оптимальные пороги сжатия зависят от сложности задачи и длины документа: для сложных задач подходит более агрессивное сжатие, чтобы отфильтровать спекулятивный шум рассуждений, а для длинных документов лучше применять более легкое сжатие, чтобы сохранить разрозненные ключевые сведения.

Посмотреть источник

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

Связанные статьи

Byreal запускает on-chain AI-торгового помощника RealClaw с поддержкой расширения навыков третьими сторонами

Прогресс проекта ИИ-агент

Byreal 13 апреля запустила on-chain AI-торгового помощника RealClaw. Инструмент основан на фреймворке OpenClaw, поддерживает расширение навыков сторонними разработчиками; пользователи могут настраивать торговые стратегии. В настоящее время он находится на стадии Alpha-тестирования и предоставляется только приглашенным пользователям.

GateNews4ч назад

Astriax получает $50M инвестиции от Paradigm, чтобы ускорить торговлю под управлением ИИ

ИИ-агент Новости индустрии ИИ

Astriax получила $50M инвестиции от Paradigm, позиционируя себя как лидера в AI-управляемой торговле on-chain. Это партнерство укрепляет институциональное доверие в DeFi, делая акцент на автономном исполнении и продвинутой аналитике для оптимизации торговых стратегий и улучшения управления ликвидностью.

BlockChainReporter5ч назад

Появился открытый ИИ-агент Hermes Agent, обладающий долговременной памятью и способный заменить OpenClaw

ИИ-агент

Nous Research выпустила с открытым исходным кодом AI Agent-фреймворк Hermes Agent, обладающий механизмом долгосрочной памяти на базе SQLite и архитектурой саморазвития, поддерживает одним кликом перенос памяти и навыков OpenClaw. Процесс установки включает девять шагов, чтобы обеспечить безопасность, которую можно выполнять в изолированной среде через Docker. Кроме того, Hermes Agent поддерживает развертывание локальных моделей, что подходит пользователям, которые уделяют приоритетное внимание конфиденциальности данных.

MarketWhisper10ч назад

Коготь Aethir позволяет агентам ИИ выполнять творческие рабочие процессы

ИИ-агент Токены ИИ

Aethir Claw — это децентрализованная платформа облачных GPU, которая позволяет автономным агентам Designer AI для создания контента, меняя подход к тому, как ИИ генерирует визуальные материалы и медиа без человеческих запросов. Она повышает масштабируемость, автоматизацию и креативность в цифровом производстве.

BlockChainReporter11ч назад

ЦРУ: Пусть ИИ напишет свой первый разведывательный доклад — а следующие на очереди уже «коллеги» ИИ

ИИ-агент Новости индустрии ИИ

Кратко Заместитель директора ЦРУ Майкл Эллис подтвердил, что агентство подготовило свой первый в истории полностью сгенерированный с помощью ИИ разведывательный отчет. Эллис изложил дорожную карту для ИИ-«сотрудников» в рабочих процессах аналитиков — и в течение ближайшего десятилетия сотрудники будут управлять командами ИИ-агентов. Это заявление появилось на фоне того, что ЦРУ

Decrypt12ч назад

Исследовательская работа Калифорнийского университета: AI-агентные маршрутизаторы имеют серьезную уязвимость, 26 секретов украдены зашифрованные учетные данные

ethereum news ИИ-агент Новости индустрии ИИ

Исследование Калифорнийского университета выявило проблемы безопасности в цепочке поставок больших языковых моделей (LLM), особенно возможные вредоносные атаки типа «злоумышленник посередине» через сторонние маршрутизаторы. Исследование показало, что 26 маршрутизаторов внедряли вредоносные команды, чтобы похищать учетные данные и конфиденциальные данные. Пользователям трудно заметить границу между обработкой учетных данных и их кражей, а «режим YOLO» усиливает риски для безопасности. Исследование рекомендует разработчикам изолировать чувствительные операции и выбирать сервисы маршрутизаторов с прозрачным аудитом, чтобы усилить защиту.

MarketWhisper12ч назад

комментарий

0/400

Нет комментариев