Claude Code の自動化研究がハッカソン優勝を獲得!受賞者:そもそも自分がどうやって勝ったのか全然分からない

Paradigm 主催の Autoresearch Hackathon において、「ほとんど自分で戦略を設計していない」参加者が、最終的に優勝を果たした。優勝者の Ryan Li は同時に SurfAI の CEO でもあり、解答プロセス全体はほぼ完全に AI に任せており、自分自身さえ「どうやって勝ったのか分からない」と語り、最終的に Prediction Market Challenge で首位を獲得した。

この大会では、模擬された二項予測マーケット上でマーケットメイク戦略を設計することが求められ、指値注文によってオーダーブックに流動性を提供し、「アービトラージャー(裁定者)」と「一般の小口投資家のフロー」の間で利益のバランスを取る。最終順位は、戦略に基づいて 200 回のランダムシミュレーションにおける平均 edge(利潤の優位性)で計算される。Ryan の最終成績は 42.32 ドルの mean edge(3 つのランダムシードの中央値で計算)で、再評価後に首位に登り詰めた。

Claude Code + Codex による自動リサーチで 1039 個の戦略を生成

従来のクオンツ取引やマーケットメイク戦略が人間の専門家によるパラメータ調整やモデリングに依存していたのとは異なり、Ryan は近年 Rich Sutton が提唱した「Bitter Lesson(苦い教訓)」の考え方を採用し、計算力と探索規模で人間の経験を打ち負かす。彼は問題全体を「自動リサーチ(autoresearch)」のプロセスに変換し、手動で最適化するのではなく、複数の AI agent を並列にして解法空間を探索した。

その過程で彼は、8 から 20 までの並列稼働の AI agent(主に Claude Code をベースにし、Codex で補助)を投入し、それぞれが異なる仮説とパラメータ空間を担当して、継続的に戦略を生成し、シミュレーションを実行し、結果をフィードバックした。最終的に、1,039 個の戦略バリエーションを累積して 2,000 回以上の評価を行い、さらに 47 個のパラメータスキャン用スクリプトを自動生成した。全体の探索規模は、数週間の手作業による実験を数時間に圧縮したのに相当する。

AI が出力した 900 行の Python のマーケットメイクアルゴリズムがハッカソン優勝

戦略面では、最終的に勝ち残った案は、約 900 行の Python で構築されたマーケットメイクアルゴリズムであり、コアロジックは単一の設計に由来するのではなく、「有効性が検証された」複数のモジュールを積み重ねたものだ。具体的には、裁定者が必勝となる極めて狭いスプレッドの領域を避けること、情報理論に基づいて真の価格を推定すること、裁定リスクに応じて提示規模を動的に調整すること、そして相手のオーダーブックが食い尽くされると高い利益が得られる領域に積極的に入り込むことなどが含まれる。

中でも最も重要なブレークスルーは、「既存の戦略を完全に捨てて、ゼロから始める」AI agent から生まれた。全体の最適化が約 +25 edge で停滞していたとき、その agent は単独で、 「裁定リスク確率」を中核とする sizing(サイズ決定)モデルを発見し、その結果として戦略のパフォーマンスは一気に +44 まで押し上げられ、これが大会の転機になった。この結果はまた、Ryan の方法論を直接裏付けてもいる。探索が局所最適に陥ったときは、微調整よりも再起動のほうが有効だ、ということだ。

AI 研究の絶対的な優位性:自動化された試行錯誤

Ryan はまとめの中で、この大会の鍵は「賢い戦略」を設計することではなく、アイデアを大規模に検索・検証し、淘汰できるシステムを構築することだと述べた。人間の直感に頼るよりも、AI に広大な解空間の中で試行錯誤させ、並列化と自動化によって効率を拡大するほうがよい。

この事例はさらに、「Agentic AI(エージェンティック AI)」がエンジニアリングや研究プロセスにおいて担う役割の変化を強化する。AI はもはや単なる補助ツールではなく、探索と意思決定の核心を直接担う実行単位になり得る。高度に構造化され、シミュレーション可能な問題においては、人間がそもそも「解答者」から完全に離れ、探索フレームワークと評価メカニズム自体を設計することさえ可能だ。

この記事は Claude Code による自動リサーチがハッカソン優勝!受賞者:僕はそもそもどうやって勝ったのか全然知らない—最初に 鏈新聞 ABMedia に掲載されました。

免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は免責事項をご参照ください。

関連記事

香港、予測市場と違法賭博への懸念を理由にバスケットボール賭博プロジェクトを停止

香港政府は、違法賭博に関連した予測市場の急速な拡大に対する懸念を理由に、バスケットボール賭博プロジェクトを停止しました。月間の取引量が大幅に増加する中、当局は公衆への教育を強化し、賭博対策で協力することを目指しています。

GateNews5時間前

香港はバスケットボール賭博の合法化を停止、予測市場への影響とコンプライアンス上の問題を調査

香港では今週、バスケットボール賭博の合法化を一時停止し、同時に調査を開始して、予測市場が香港で与える影響と普及度を評価する計画だ。香港民政・青年局局長のマイ・メイジン(麦美娟)は、予測市場の月間取引金額が2年前の1億ドル未満から、昨年は130億ドル超にまで増加しており、そのうち約40%がスポーツ関連だと述べた。

MarketWhisper7時間前

Polymarket、インサイダー取引懸念でビルダーズ・プログラムのスタートアップを監査開始 - Unchained

ポリマーケットは、成功した取引を模倣することでインサイダー取引を助長し得る可能性のあるサードパーティツールを見つけたことを受け、自社のビルダーズ・プログラムの監査を開始しました。このレビューは、これらのアプリに関連する市場乱用の可能性をめぐる精査の流れを受けています。

UnchainedCrypto9時間前

Kalshi、ネバダのイベント契約禁止の上訴へ CFTCの管轄争いは最高裁まで及ぶ可能性

予測市場プラットフォームのKalshiは、ネバダ州が同社の試合(イベント)契約を禁止する裁決に対して上訴し、米国第9巡回控訴裁判所は4月17日に口頭弁論を行ったが、審理後すぐに判決は出されなかった。この案件の中核的争点は、Kalshiのイベント契約が商品先物取引委員会(CFTC)が管轄する「スワップ契約」に当たるのか、それとも各州のギャンブル(賭博)ライセンス規制の対象となるのか、という点にある。複数の法律専門家は、本件が最終的に米国最高裁判所へ上訴される可能性があると予測している。

MarketWhisper10時間前

CFTC 議長セリグ氏:予測市場の詐欺を行う者は法律で厳罰、規則制定の停止は拒否

米国CFTC(商品先物取引委員会)議長のセリグ氏は、下院の公聴会で、市場に対する詐欺や操作に対して「ゼロ容認方針」を取ることを強調した。彼は、5億ドル規模の原油先物取引に関する質問に回答し、またCFTCが予測市場の規制ルールを策定していると述べた。セリグ氏はさらに、SEC(米国証券取引委員会)との間で協力覚書を締結し、デジタル資産の監督を強化するとした。CFTCの現状が自分だけの委員である点について、セリグ氏は機関の運営効率を強調し、監督能力を高めるために新たな職員を採用するとした。

MarketWhisper12時間前

予測市場の市場シェア分布が明らかに、Kalshiが37.8%で首位

Gate Newsのメッセージ。最新データによると、予測市場プラットフォーム間での市場シェアの分布が示されています。Kalshiが37.8%の市場シェアで首位に立ち、次いでPolymarketが35.3%です。Opinion Labs xyzは14.4%で、Predict dot funは8.5%、Crypto Comは市場の2.5%を占めています。

GateNews18時間前
コメント
0/400
コメントなし