Google ResearchがReasoningBankをリリース:AIエージェントが成功と失敗から推論戦略を学ぶ

ゲートニュース 4月22日 — Google Researchは、エージェントのメモリーフレームワークであるReasoningBankをリリースしました。これは、大規模言語モデル主導のエージェントが、デプロイ後も継続的に学習できるようにするものです。このフレームワークは、成功したタスク経験と失敗したタスク経験の両方から普遍的な推論戦略を抽出し、それらをメモリーバンクに保存して、同様の将来のタスクでの検索と実行に活用します。関連論文はICLRで公開されており、コードはGitHubでオープンソース化されています。

ReasoningBankは、既存の2つのアプローチを改良しています。Synapseは完全な行動の軌跡を記録しますが、きめ細かな粒度のために転用可能性が限られています。また、Agent Workflow Memoryは成功したケースのみから学習します。ReasoningBankは2つの重要な変更を行います。"アクションシーケンス"ではなく"推論パターン"を保存し、各メモリにタイトル、説明、コンテンツの構造化フィールドを含めること。そして、失敗の軌跡を学習に取り込むことです。このフレームワークは、実行軌跡を自己評価するモデルを使用し、失敗の経験を「落とし穴回避ルール」へと変換します。たとえば、ルール"見かけたらLoad Moreボタンをクリックする"は、"まず現在のページ識別子を確認し、無限スクロールのループを避けてから、load moreをクリックする"へと進化します。

この論文は、Memory-aware Test-time Scaling (MaTTS)も導入しています。これは推論中に追加の計算を割り当て、複数の軌跡を探索して、その発見をメモリーバンクに保存するものです。並列拡張では同一タスクに対して複数の異なる軌跡を実行し、自己比較によってより頑健な戦略を洗練します。一方で逐次拡張では単一の軌跡を反復的に改良し、推論の途中結果をメモリに保存します。

Gemini 2.5 FlashをReActエージェントとして用いたWebArenaのブラウザタスク、およびSWE-Bench-Verifiedのコーディングタスクでは、ReasoningBankは、メモリなしのベースラインと比べてWebArenaで成功率が8.3%高く、SWE-Bench-Verifiedでは4.6%高くなりました。さらに、タスクあたりの平均ステップ数を約3%減らしました。並列拡張 (k=5)でMaTTSを追加すると、WebArenaの成功率はさらに3ポイント向上し、ステップ数もさらに0.4減少しました。

免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は免責事項をご参照ください。

関連記事

NeoCognition、業務で学ぶAIエージェント向けシード資金$40M を調達

Gate Newsメッセージ、4月22日—AI研究ラボのNeoCognitionは、$40 百万ドルのシードラウンド完了を発表し、ステルスモードからの脱却を果たしました。オハイオ州立大学の准教授Yu Suが、Xiang DengおよびYu Guとともに設立した同社は、カリフォルニア州パロアルトに本社を置いています。このラウンド

GateNews6分前

オンデバイス鍵管理を備えたAIエージェントウォレットをPicWeが発表

PicWeは、リカバリーフレーズ不要のAIエージェント対応、オンデバイス鍵ウォレットであるPicWe Walletのパブリックベータを発表しました。マルチチェーン資産、スワップ、AIが利用可能な自動化をサポートし、RWAインフラを統合することを目指しています。 PicWeは、鍵をオンデバイスに保存し、リカバリーフレーズを排除し、重要な操作をローカルに保つAIエージェント対応ウォレット「PicWe Wallet」のパブリックベータをローンチしました。ベータでは、マルチチェーン資産管理、スワップ、ステーブルコインに基づく手数料をサポートしつつ、プログラマブルなAIによる対話を可能にします。より広範なPicWeの取り組みにより、このプラットフォームは実世界資産(RWA)の統合インフラとして位置づけられ、発行、流通、決済、クロスボーダー決済、トークン化、企業向けユースケースのためのサプライチェーン連携を可能にします。

GateNews50分前

Hugging Faceがオープンソース化したml-intern:自律型ML研究のためのAIエージェント

オープンソースのml-intern。Hugging Faceの自律型ML研究エージェントで、論文を読み、データをキュレーションし、学習・評価を行い、科学・医学・数学にわたって反復します。 概要:Hugging Faceのml-internはオープンソースの自律型ML研究エージェントで、論文を読み、データセットをキュレーションし、ローカルまたはクラウドのGPUで学習し、結果を評価して改善を反復します。CLIとWebインターフェースを備えたsmolagents上に構築されており、arXiv/HF Papers、HF Hub、HF Jobsをナビゲートします。デモは科学・医学・数学にまたがり、エンドツーエンドの自動化とパフォーマンス向上を示しています。

GateNews54分前

清華教授・戴季峰がNaive.aiを立ち上げ、$300M の資金調達($800M 評価)

Gate Newsメッセージ、4月22日――清華大学 電子工学部の准教授・戴季峰氏が、オープンソースのモデル事後学習とAIエージェントに注力するNaive.aiを設立した。スタートアップは、推定企業価値$80で、$300 百万ドル規模の資金調達を行った

GateNews2時間前

AWS、マルチエージェントAIワークフローを拡大。BedrockでClaude Opus 4.7をサポート

ゲートニュース メッセージ、4月22日 — Amazon Web Servicesは、マルチエージェントのワークフローを通じて、自社のエージェント型AIイニシアチブを拡大すると発表しました。Amazon Bedrock上でAnthropicのClaude Opus 4.7をサポートし、顧客が生成AIの試験運用を超えて前進できるよう支援します。同社は、顧客が単一のAIツールから、複数の専門エージェントをつなぐシステムへ移行するのに合わせて、パートナー関係を拡大しています。

GateNews2時間前

0G Labs、Alibaba Cloudと提携し、QwenモデルへのオンチェーンAIエージェントアクセスを実現

Gate Newsメッセージ、4月22日――0G Labsは、AIエージェントが0Gのブロックチェーン基盤を通じて、AlibabaのQwen大型言語モデルをオンチェーンで直接呼び出せるようにするため、Alibaba Cloudとの提携を発表しました。このコラボレーションは、APIベースのアプローチから、AIアクセスのパラダイムを、プログラム可能でトークン化されたAIインフラへと移行することを示しています。そこでは、AIエージェントが0Gネットワーク上で推論のためにQwenを呼び出し、検証は0Gが取り扱います。

GateNews3時間前
コメント
0/400
コメントなし