Anthropic が Advisor 戦略を提供:Opus を顧問として、Sonnet と組み合わせて実行し、パフォーマンスが向上しコストが 12% 削減

ChainNewsAbmedia

Anthropic は4月9日に「Advisor 戦略」を Claude Platform に正式に導入すると発表し、開発者は Messages API を通じて Opus に助言役を担わせ、Sonnet または Haiku を実行者として組み合わせることで、1回の API リクエスト内で Opus と同等に近い知的パフォーマンスを実現しつつ、大幅にコストを引き下げられるようになりました。この機能は現在、公開ベータ版の形で提供されています。

動作メカニズム:実行者が難題に直面すると自動的に Opus に相談

Advisor 戦略の中核となる概念は、推論と実行を分離することです。開発者が Messages API の呼び出しに advisor ツールを追加すると、Sonnet または Haiku の agent がタスクの実行中に難しい意思決定に直面した際、自動的に Opus に問い合わせて、計画に関する提案を得たうえで実行を続行します。プロセス全体は単一の API リクエスト内で完結し、開発者が追加で段取りを組む必要はありません。

このアーキテクチャは、チーム内でのベテラン顧問と実行担当の役割分担に似ています。Opus が上位の戦略判断を担当し、Sonnet または Haiku が実際の操作を担当し、両者は同一のワークフローで協働します。

実測:パフォーマンス向上かつコスト低下

Anthropic が公開した評価データによると、SWE-bench Multilingual のベンチマークテストでは、Opus advisor を組み合わせた Sonnet の表現は、単独の Sonnet より 2.7 パーセントポイント高く、また 1 タスクあたりのコストは逆に 11.9% 低下しました。

コストが下がる理由は、大部分のタスクがより安価な Sonnet または Haiku によって処理され、重要な意思決定のポイントでのみ Opus が呼び出されるためです。これにより、Opus を全工程で使う場合の高額な費用を回避できます。

開発者にとっての意義

Advisor 戦略は、AI agent を構築する開発者に対して、新しいコストと効率のトレードオフの選択肢を提供します。これまで開発者は、「コストは高いが Opus を全工程で使用する」か、「コストは抑えられるが Sonnet を全工程で使用して複雑な問題に直面すると失誤する可能性があるか」の間で選ばなければなりませんでした。現在は、混合アーキテクチャで両者の利点を得られます。

コミュニティの反応は熱烈で、ある開発者はこれを「百万人富豪」番組における「電話で助けを求める」ための命綱だと例えています。実行者は普段は独立して作業し、本当に難しい問題に直面したときだけ達人に助けを求める、というわけです。

この記事「Anthropic が Advisor 戦略を提供:Opus を顧問として Sonnet と組み合わせ、パフォーマンスが向上しコストが 12% 低下」は 最初に 鏈新聞 ABMedia に掲載されました。

免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は免責事項をご参照ください。

関連記事

NEAは原子力規制における人工知能の活用を調査しています

NEAの新技術に関する作業部会は、3月25日から26日にかけてワークショップを開催し、原子力当局の規制監督と内部業務に対して人工知能をどのように適用できるかに焦点を当てた。 概要 NEAのワークショップでは、原子力分野における規制のための実世界のAI活用事例を探った。

Cryptonews1時間前

4月19日、北京のハーフマラソンで中国が300体超のヒューマノイドロボットをテストへ

北京の第2回ロボットハーフマラソンでは、70チームから300体超のヒューマノイドロボットが21kmのコースで競う。自律移動の進歩が注目され、40%が無制御で稼働する。製造上の課題にもかかわらず、中国はヒューマノイドロボット市場を支配している。

GateNews3時間前

米国、AI主導の原子力発電所を動かすためにナミビア産ウラン輸入の増加を目指す

米国は、AIデータセンター向けの原子力エネルギーを支えるために、ナミビアからのウラン輸入の増加を検討している。中国がナミビアのウラン部門を支配している。ウラン価格の上昇が鉱山への関心を呼び戻しているが、乾燥地域での水の供給に課題がある。

GateNews3時間前

OpenAIの幹部ビル・ピーブルズ氏とケビン・ウェイル氏、リーダーシップの組み替えで退任

OpenAIの幹部であるビル・ピーブルズ氏とケビン・ウェイル氏が退任を発表し、同社が業務を分散化する一連のリーダーシップ変更の一環となった。両氏の退任は、ほかにもいくつかの注目度の高い退任に続き、同社の組織体制の変更を伴っている。

GateNews4時間前

ZoomがWorldと提携し、顔認識でディープフェイク検出を追加

Zoomは、ビデオ通話中に実在の参加者をAIディープフェイクと見分ける機能を立ち上げるため、Sam AltmanのWorldと提携しました。これは、ホストと参加者向けの検証オプションを用意することで、増加するディープフェイク詐欺への対抗を目的としています。

GateNews5時間前

AI生成のバグ報告がcURLの保守チームを圧倒

AIが生成したバグ報告がcURLプロジェクトに殺到しており、投稿件数の大幅な増加によりリソースが逼迫しています。管理者たちは、AIモデルへのアクセスを制限し、流入への対応のため脆弱性報奨プログラムを停止することで対処しています。

GateNews5時間前
コメント
0/400
コメントなし