A Ramp Labs apresenta uma nova solução para a partilha de memória entre múltiplos agentes, reduzindo o consumo de tokens em até 65%

GateNews

2026-04-11 05:14:49

Notícias do Gate News, a 11 de abril, a empresa de infraestruturas de IA Ramp Labs publicou resultados de investigação «Latent Briefing», permitindo uma partilha eficiente de memória entre sistemas multiagente através da compressão direta da cache KV de grandes modelos. Isto faz uma grande redução do consumo de Tokens sem perda de exatidão. Nas arquiteturas multiagente mais comuns, o orquestrador (Orchestrator) decompõe tarefas e chama repetidamente modelos de trabalhadores (Worker). À medida que a cadeia de inferência se vai tornando mais longa, a quantidade de Tokens cresce de forma exponencial. A ideia central do Latent Briefing é, com o auxílio do mecanismo de atenção, identificar as partes verdadeiramente essenciais no contexto e eliminar informação redundante diretamente na camada de representação, em vez de depender de resumos de LLM que são lentos ou de pesquisas RAG com baixa estabilidade. Nos testes de referência do LongBench v2, o método teve um desempenho notável: o consumo de Tokens do modelo Worker diminuiu 65%, a mediana de Tokens poupados em documentos de comprimento médio (32k a 100k) atingiu 49%, a exatidão global melhorou cerca de 3 pontos percentuais face à linha de base e o tempo adicional para cada compressão foi apenas de cerca de 1,7 segundos, o que equivale a acelerar aproximadamente 20 vezes em relação ao algoritmo original. O experimento usou Claude Sonnet 4 como orquestrador e Qwen3-14B como modelo de trabalhador, cobrindo cenários de documentos variados, como artigos académicos, documentos jurídicos, romances e relatórios governamentais. O estudo também descobriu que o limiar de compressão ideal varia em função da dificuldade da tarefa e do comprimento do documento — para tarefas difíceis, é mais adequado uma compressão mais agressiva para filtrar ruído de inferência oportunista; para documentos longos, é mais apropriada uma compressão mais ligeira para preservar informação-chave dispersa.

Ver fonte

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Análise em profundidade da Nous Research: o laboratório de IA descentralizada que aposta numa avaliação de 1 mil milhões da Paradigm, com uma decomposição completa do modelo Hermes e da rede Psyche

Progresso do projeto Agente de IA Notícias do setor de IA

A Nous Research é um laboratório de IA de código aberto, focado nos modelos da série Hermes, tendo recebido um investimento da Paradigm de 50 milhões de dólares em 2025, com uma avaliação de 1 mil milhões. O seu diferencial reside em desenvolver primeiro tecnologia de IA por uma equipa crypto native e, em seguida, integrá-la com a blockchain. O produto principal, o modelo Hermes, foi concebido com a filosofia de reduzir a taxa de rejeição, e as suas fontes de dados baseiam-se sobretudo em dados sintéticos. Em simultâneo, a Psyche Network constrói, na Solana, uma rede de treino de IA descentralizada, incentivando os participantes através de um mecanismo de tokens. A Nous Research adota estratégias de código aberto e descentralização, com o objetivo de demonstrar a sua competência técnica e a sua viabilidade.

ChainNewsAbmedia11h atrás

A Byreal lança o assistente de negociação de IA em cadeia RealClaw, com suporte para extensões de competências de terceiros

Progresso do projeto Agente de IA

A Byreal lançou em 13 de abril o assistente de negociação de IA on-chain RealClaw, uma ferramenta baseada na framework OpenClaw, que suporta extensões de competências de terceiros; os utilizadores podem personalizar as suas estratégias de negociação. Neste momento, encontra-se em fase de testes Alpha e apenas está disponível para utilizadores convidados.

GateNews15h atrás

Astriax Obtém $50M Investimento da Paradigm para Acelerar a Negociação Orientada por IA

Agente de IA Notícias do setor de IA

A Astriax garantiu um $50M investimento da Paradigm, posicionando-se como líder em negociação on-chain orientada por IA. Esta parceria reforça a credibilidade institucional no DeFi, com foco na execução autónoma e na analítica avançada para otimizar as estratégias de negociação e melhorar a gestão da liquidez.

BlockChainReporter16h atrás

O agente Hermes da IA open source chegou ao mercado, com memória a longo prazo e capaz de substituir o OpenClaw

Agente de IA

A Nous Research publicou uma framework open source de AI Agent chamada Hermes Agent, com um mecanismo de memória de longo prazo baseado em SQLite e uma arquitectura de auto-evolução, suportando migração com um clique da memória e competências do OpenClaw. O processo de instalação inclui nove passos, garantindo a segurança com execução em ambientes isolados via Docker. Além disso, o Hermes Agent suporta a implementação de modelos localmente, sendo adequado para utilizadores que valorizam a privacidade dos dados.

MarketWhisper22h atrás

Aethir Claw permite que agentes de IA executem fluxos de trabalho criativos

Agente de IA Tokens de IA

Aethir Claw é uma plataforma descentralizada de cloud GPU que permite agentes autónomos de IA Designer para criação de conteúdos, revolucionando a forma como a IA gera visuais e media sem prompts humanos. Aumenta a escalabilidade, a automação e a criatividade na produção digital.

BlockChainReporter23h atrás

Comentário

0/400

Sem comentários