A Google Research lança o ReasoningBank: agentes de IA aprendem estratégias de raciocínio com sucesso e falha

Mensagem do Gate News, 22 de abril — A Google Research lançou o ReasoningBank, um framework de memória do agente que permite que agentes orientados por grandes modelos de linguagem aprendam continuamente após o deploy. O framework extrai estratégias universais de raciocínio tanto de experiências bem-sucedidas como falhadas em tarefas, guardando-as num banco de memória para recuperação e execução em tarefas futuras semelhantes. O artigo associado foi publicado na ICLR, e o código foi disponibilizado em open-source no GitHub.

O ReasoningBank melhora duas abordagens existentes: a Synapse, que regista trajectórias completas de acções, mas tem capacidade de transferência limitada devido à granularidade fina, e a Agent Workflow Memory, que só aprende com casos bem-sucedidos. O ReasoningBank introduz duas alterações-chave: armazenar “padrões de raciocínio” em vez de “sequências de acções”, com cada memória contendo campos estruturados para título, descrição e conteúdo; e incorporar trajectórias de falha na aprendizagem. O framework usa um modelo para autoavaliar trajectórias de execução, transformando experiências de falha em regras anti-erro. Por exemplo, a regra “clicar no botão Carregar mais quando o vir” evolui para “verificar primeiro o identificador da página actual, evitar ciclos de scroll infinito e, em seguida, clicar em carregar mais.”

O artigo também introduz Memory-aware Test-time Scaling (MaTTS), que aloca compute adicional durante a inferência para explorar múltiplas trajectórias e guardar os resultados no banco de memória. A expansão em paralelo executa múltiplas trajectórias distintas para a mesma tarefa, refinando estratégias mais robustas através de auto-comparação; a expansão sequencial refina iterativamente uma única trajectória, guardando raciocínio intermédio em memória.

Em tarefas de browser do WebArena e tarefas de codificação SWE-Bench-Verified usando Gemini 2.5 Flash como agente ReAct, o ReasoningBank alcançou uma taxa de sucesso 8,3% superior no WebArena e 4,6% superior no SWE-Bench-Verified em comparação com uma linha de base sem memória, reduzindo em aproximadamente 3 o número médio de passos por tarefa. Adicionar MaTTS com expansão em paralelo (k=5) melhorou ainda mais a taxa de sucesso no WebArena em 3 pontos percentuais e reduziu os passos em mais 0,4.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

NeoCognition Capta $40M em Financiamento de Seed para Agentes de IA de Aprendizagem no Trabalho

Mensagem do Gate News, 22 de Abril — O laboratório de investigação em IA NeoCognition anunciou a conclusão de uma ronda de seed de $40 milhões, saindo do modo stealth. Fundada pelo Professor Associado da Universidade Estadual de Ohio Yu Su, juntamente com Xiang Deng e Yu Gu, a empresa tem sede em Palo Alto, Califórnia. A ronda w

GateNews6m atrás

PicWe Lança Carteira com Agente de IA com Gestão de Chaves no Dispositivo

PicWe anuncia uma versão beta pública do PicWe Wallet, uma carteira de chaves sem frases de recuperação, com agentes de IA e capaz de funcionar no dispositivo. Suporta ativos multi-cadeia, swaps, automação acessível por IA e tem como objetivo unificar a infraestrutura de RWA. A PicWe lançou a versão beta pública do PicWe Wallet, uma carteira com agentes de IA que armazena as chaves no dispositivo, elimina as frases de recuperação e mantém operações críticas locais. A beta suporta gestão de ativos multi-cadeia, swaps e pagamentos de taxas baseadas em stablecoins, ao mesmo tempo que permite interações programáveis com IA. As iniciativas mais amplas da PicWe posicionam a plataforma como uma infraestrutura unificada para ativos do mundo real, possibilitando emissão, circulação, liquidação, pagamentos transfronteiriços, tokenização e coordenação da cadeia de abastecimento para casos de uso empresariais.

GateNews50m atrás

Hugging Face disponibiliza em código aberto o ml-intern, um agente de IA para investigação autónoma em ML

Com código aberto, ml-intern da Hugging Face, um agente autónomo de investigação em ML que lê artigos, seleciona dados, treina, avalia e evolui entre a ciência, a medicina e a matemática. Resumo: ml-intern da Hugging Face é um agente autónomo de investigação em ML de código aberto que lê artigos, seleciona conjuntos de dados, treina em GPUs locais ou na cloud, avalia resultados e melhora iterativamente. Construído com smolagents, com interfaces de linha de comandos (CLI) e web, navega por arXiv/HF Papers, HF Hub e HF Jobs. As demonstrações abrangem ciência, medicina e matemática, evidenciando automação de ponta a ponta e ganhos de desempenho.

GateNews54m atrás

Professor da Tsinghua Dai Jifeng Lança Naive.ai, Angaria ~$300M a $800M Valuation

Mensagem do Gate News, 22 de abril — Dai Jifeng, professor associado no Departamento de Engenharia Eletrónica da Universidade Tsinghua, fundou a Naive.ai, uma empresa focada no pós-treinamento de modelos de código aberto e em agentes de IA. A startup angariou aproximadamente $300 milhões numa valorização estimada de $80

GateNews2h atrás

AWS Expands Multi-Agent AI Workflows, Supports Claude Opus 4.7 on Bedrock

Gate News message, April 22 — Amazon Web Services announced expansion of its agentic AI initiatives through multi-agent workflows, supporting Anthropic's Claude Opus 4.7 on Amazon Bedrock to help customers move beyond generative AI pilots. The company is expanding partner relationships as customers

GateNews2h atrás

0G Labs faz parceria com a Alibaba Cloud para permitir acesso de agentes de IA na cadeia ao modelo Qwen

Mensagem de Gate News, 22 de abril — 0G Labs anunciou uma parceria com a Alibaba Cloud para permitir que agentes de IA invoquem diretamente o modelo grande de linguagem Qwen da Alibaba na cadeia, através da infraestrutura blockchain da 0G. A colaboração assinala uma mudança nos paradigmas de acesso à IA, passando de abordagens baseadas em APIs para uma infraestrutura de IA programável e tokenizada, na qual os agentes de IA podem chamar o Qwen para inferência diretamente na rede 0G, com a verificação tratada pela 0G.

GateNews3h atrás
Comentar
0/400
Nenhum comentário