カープathy:AI能力の認識に深刻な断層が見られ、無料版と最先端のエージェントは「完全に別の製品」

元テスラAI総監の前職で、OpenAIの創設メンバーであるAndrejo Karpathyは、4月9日にX上で長文を投稿し、公衆のAI能力に対する認識が深刻に分断されつつあると指摘した。彼は、無料版ChatGPTを使う人と、毎日Codex、Claude Codeなどの最先端のエージェントツールを使う技術者は、実際には「まったく別の製品」を議論しているのだが、双方とも自分が見ているものがAIの全貌だと思っている、と考えている。

2つの世界、2種類のAI認知

Karpathyは、現在のAI利用者を2つのグループに分けている。

1つ目のグループの人たちは、去年のどこかの時点でChatGPTの無料版を試し、それによってAI全体に対する印象を形成した。彼らが目にするのは、モデルのさまざまな失敗だ――幻覚、検索結果の支離滅裂、音声モードで「車で行くべきか、それとも歩いて洗車に行くべきか」といった単純な質問ですら失敗する。Karpathyは、これらの問題が確かに存在することを認めつつも、無料版と旧式モデルでは、2026年の最先端エージェントモデルの真の能力を代表できないと強調している。

2つ目のグループの人たちは、2つの条件を同時に満たす。最新の最先端エージェントモデル(OpenAI CodexやClaude Codeなど)を有料で使っていること、そしてプログラム開発、数学、研究などの技術分野で専門的に活用していることだ。Karpathyは、この人たちが非常に高い「AI精神的衝撃」(AI Psychosis)を経験していると述べている。なぜなら、これらのモデルの技術領域における最近の進歩は「驚くほかない」としか言いようがなく――あなたは目の前で、それまで数日、場合によっては数週間かかっていたプログラムの構造化の問題を、たった1時間で解決してしまうのを見ていられる。

なぜ進歩は技術領域に集中するのか

Karpathyは、AIの能力向上がなぜプログラム開発などの技術領域で特に顕著で、検索、文章作成、提案など一般用途ではあまり明確ではないのかを説明した。

理由は2つある。1つ目は、技術領域には検証可能な報酬関数があることだ(例えば単体テストが通るかどうか)。これにより強化学習の訓練が効果的に機能する。対して文章の品質の良し悪しは明確に判定しにくい。2つ目は、技術領域がB2Bの場面でより大きな商業価値を持つため、AI企業が最大の割合のチームリソースをこれらの方向に投入していることだ。

2つのグループは互いに相手の言っていることが分からない

Karpathyはまとめとして、これら2つのグループは「それぞれ別の話をしている」と述べた。OpenAIの無料版の音声モードが日常の問題をうまく処理できないのに対し、OpenAIの最上位の有料版Codexは、1時間でプログラム全体のコードベースを再構築したり、システム上の脆弱性を見つけたりできる――この2つは同時に成り立つ。

その後の返信で、彼は補足した。誰かが彼に次の見解を提示したのだ。「OpenClaw事件がこれほど大きな社会的注目を集めたのは、それが大量の非技術者にとって初めて、最新のエージェントモデルに触れる機会になったからだ。これらの人たちはそれまで、AIとはChatGPTのWeb版のことだとしか知らなかった。」

この記事 Karpathy:AI能力認知に深刻な断層が生じている、無料版と最先端のAgentは「まったく別の製品」 は、最初に 鏈新聞 ABMedia に掲載された。

免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は免責事項をご参照ください。

関連記事

AI自動販売エージェント「Valerie」はOpenClawでサンフランシスコの自動販売機を運用しています

AIエージェント「Valerie」は、OpenClaw上でサンフランシスコの自動販売機を今稼働しており、価格設定、マーケティング、そして現実世界の現金まで含めて、人々がどこまでコードを信頼するのかを試しています。 要約 AIエージェント「Valerie」は、OpenClawフレームワークを使ってサンフランシスコで実際の自動販売機を運用し、価格を設定し、名称を付けて

Cryptonews7時間前

Mastercard、LobstercashおよびCrossmintとの提携でAIエージェント決済を可能に

MastercardはLobstercashおよびCrossmintと提携し、既存のクレジットカードおよびデビットカードを通じてAIエージェントの決済を可能にし、新しいウォレットは必要なく現在の金融システムに統合します。この提携により、AIが取引を自動化し、効率とセキュリティを向上させます。

GateNews12時間前

中国チーム EvoMap が怒り爆発、爆発的に話題になった Hermes Agent の盗用:自律進化システムには高い類似性が存在

中国のチームEvoMapは、Nous ResearchのHermes Agentが自社のEvolver/GEPアーキテクチャを盗用していると非難しており、両者が複数の重要なモジュールで非常に類似していると考えています。EvoMapによれば、Hermesの設計は自分たちが以前に公開した内容を参照せず、また謝意も示していないとのことで、論争が起きたことによりコミュニティの注目が広がり、中国の一部のネットユーザーがEvoMapを支持し、Hermesの盗用行為を批判しています。Nous研究チームはまだ、申し立てに対して逐条で反論していないものの、事件はすでにAIの世論の中で急速に拡散しています。

ChainNewsAbmedia12時間前

OpenAI、デスクトップを制御し開発ワークフローを自動化するAIエージェントとしてCodexを更新

OpenAIのアップグレード版Codexは、コーディングアシスタントからデスクトップ環境向けの自律エージェントへ進化し、アプリケーションの管理、ワークフローの自動化、100以上のアプリとの統合が可能になりました。この変化はタスクの継続性とワークフロー自動化を強化し、AIコーディングツールの競争環境を反映しています。

GateNews13時間前

Agile Soda、文書分類精度98%のAgentic OCRプラットフォームを発表

Agile Sodaは、事前学習を不要にし、即時に導入できるAI駆動のドキュメント自動化プラットフォーム「Agentic OCR」をリリースしました。分類と抽出の高精度を提供し、ユーザーの修正によって継続的に改善されます。将来的にはさらなる機能強化も計画しています。

GateNews17時間前

アメリカン・エキスプレス、2026年Q2にAI経費スタートアップのHyperを買収へ

アメリカン・エキスプレスは、商業クライアント向けの経費管理ツールを強化するため、AIスタートアップのHyperを買収します。買収は2026年Q2に完了する見込みで、2024年に提携して共同ブランドのリワードカードを立ち上げたことに続くものです。

GateNews18時間前
コメント
0/400
コメントなし