Karpathy: Pengenalan kemampuan AI mengalami kegagalan yang serius, versi gratis dan Agent terdepan adalah "produk yang sepenuhnya berbeda"

Mantan Kepala AI Tesla dan salah satu pendiri OpenAI, Andrej Karpathy, pada 9 April memublikasikan sebuah tulisan panjang di X, dengan mengatakan bahwa pemahaman publik tentang kemampuan AI sedang mengalami perpecahan yang serius. Ia berpendapat bahwa orang yang menggunakan ChatGPT versi gratis dan teknisi yang setiap hari menggunakan alat agent mutakhir seperti Codex dan Claude Code, sebenarnya sedang membahas “produk yang sepenuhnya berbeda”, tetapi kedua pihak sama-sama merasa bahwa yang mereka lihat adalah gambaran utuh dari AI.

Dua dunia, dua jenis pemahaman AI

Karpathy membagi pengguna AI saat ini menjadi dua kelompok.

Kelompok pertama adalah orang yang pada suatu titik tahun lalu mencoba ChatGPT versi gratis, lalu membentuk kesan mereka secara keseluruhan tentang AI dari sana. Yang mereka lihat adalah berbagai kesalahan model—halusinasi, hasil pencarian yang tidak masuk akal, dan bahkan pola suara yang membuat kesalahan pada pertanyaan sederhana seperti “mengemudi atau berjalan pergi mencuci mobil”. Karpathy mengakui bahwa masalah-masalah ini memang ada, tetapi menekankan bahwa versi gratis dan model yang ketinggalan zaman tidak dapat mewakili kemampuan sebenarnya dari model agent mutakhir sebelum tahun 2026.

Kelompok kedua memenuhi dua syarat sekaligus: menggunakan model agent mutakhir terbaru berbayar (seperti OpenAI Codex atau Claude Code), dan menggunakan secara profesional di bidang-bidang teknis seperti pengembangan perangkat lunak, matematika, dan penelitian. Karpathy menyebut bahwa kelompok ini sedang mengalami “dampak psikologis AI” yang sangat tinggi (AI Psychosis), karena kemajuan terbaru model-model ini di bidang teknis “hanya bisa digambarkan sebagai menakjubkan”—Anda bisa benar-benar menyaksikan mereka menyelesaikan masalah arsitektur perangkat lunak yang semula memerlukan waktu berhari-hari bahkan berminggu-minggu dalam waktu kurang dari satu jam.

Mengapa kemajuan terkonsentrasi di bidang teknis

Karpathy menjelaskan mengapa peningkatan kemampuan AI tampak khususnya signifikan di bidang teknis seperti pengembangan perangkat lunak, tetapi tidak begitu menonjol pada penggunaan umum seperti pencarian, penulisan, dan pemberian saran.

Ada dua penyebab: pertama, bidang teknis menyediakan fungsi penghargaan yang dapat diverifikasi (misalnya, apakah unit test lulus), yang membuat pelatihan reinforcement learning dapat berjalan secara efektif; sementara itu, kualitas tulisan sulit untuk dinilai secara jelas. Kedua, dalam skenario B2B bidang teknis lebih bernilai secara komersial, sehingga perusahaan-perusahaan AI menginvestasikan proporsi terbesar sumber daya tim mereka ke arah-arah tersebut.

Kedua kelompok saling tidak mengerti apa yang dibicarakan pihak lain

Karpathy menyimpulkan bahwa kedua kelompok ini sedang “berbicara pada jalurnya masing-masing”. Mode suara dari versi gratis OpenAI yang membuat masalah sehari-hari berantakan, sementara Codex versi berbayar tingkat tertinggi dari OpenAI dapat, dalam satu jam, merestrukturisasi seluruh basis kode atau menemukan celah sistem—dua hal ini sama-sama benar.

Dalam balasan lanjutan, ia menambahkan bahwa ada orang yang mengajukan pandangan kepadanya: insiden OpenClaw mendapat perhatian sosial yang begitu besar karena insiden itu membuat banyak non-teknisi untuk pertama kalinya berkenalan dengan model agent mutakhir, sementara selama ini mereka hanya tahu bahwa AI itu sama dengan ChatGPT versi web.

Artikel ini Karpathy: Pemahaman tentang kemampuan AI mengalami kesenjangan serius, versi gratis dan Agent mutakhir adalah “produk yang sepenuhnya berbeda” pertama kali muncul di media ABMedia.

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Artikel Terkait

Agen vending AI “Valerie” menjalankan mesin vending San Francisco dengan OpenClaw

Agen AI 'Valerie' sekarang menjalankan mesin penjual otomatis di San Francisco di OpenClaw, menguji sejauh mana orang akan mempercayai kode dengan penetapan harga, pemasaran, dan uang tunai dunia nyata. Ringkasan Agen AI "Valerie" menjalankan mesin penjual otomatis fisik di San Francisco menggunakan kerangka OpenClaw, menetapkan harga, memberi nama

Cryptonews9jam yang lalu

Mastercard Memungkinkan Pembayaran Agen AI Melalui Kemitraan dengan Lobstercash dan Crossmint

Mastercard telah bekerja sama dengan Lobstercash dan Crossmint untuk memfasilitasi pembayaran agen AI melalui kartu kredit dan debit yang sudah ada, dengan mengintegrasikan diri ke sistem keuangan yang berjalan tanpa perlu dompet baru. Kemitraan ini memungkinkan agen AI mengotomatiskan transaksi, meningkatkan efisiensi dan keamanan.

GateNews14jam yang lalu

Tim Tiongkok EvoMap mengamuk karena Hermes Agent mendadak viral: terdapat tingkat kemiripan yang tinggi dalam sistem evolusi mandiri

Tim Tiongkok EvoMap menuduh Hermes Agent dari Nous Research melakukan plagiarisme terhadap arsitektur Evolver/GEP mereka, dengan anggapan bahwa keduanya memiliki kemiripan yang sangat tinggi pada beberapa modul kunci. EvoMap menyatakan bahwa desain Hermes tidak mengutip atau memberikan pengakuan atas konten yang sebelumnya mereka publikasikan; kontroversi ini memicu perhatian luas dari komunitas, sebagian netizen Tiongkok mendukung EvoMap, serta mengkritik tindakan plagiarisme Hermes. Meskipun tim riset Nous belum membantah tuduhan tersebut secara per poin, peristiwa ini telah cepat menyebar dalam opini publik AI.

ChainNewsAbmedia15jam yang lalu

OpenAI Memperbarui Codex Menjadi Agen AI yang Mengontrol Desktop, Mengotomatiskan Alur Kerja Pengembangan

Codex versi OpenAI yang ditingkatkan berkembang dari asisten pemrograman menjadi agen otonom untuk lingkungan desktop, yang mampu mengelola aplikasi, mengotomatiskan alur kerja, dan berintegrasi dengan lebih dari 100 aplikasi. Perubahan ini meningkatkan kesinambungan tugas dan otomatisasi alur kerja, mencerminkan lanskap kompetitif dalam alat pemrograman berbasis AI.

GateNews15jam yang lalu

Agile Soda Meluncurkan Platform Agentic OCR dengan Akurasi Klasifikasi Dokumen 98%

Agile Soda meluncurkan Agentic OCR, sebuah platform otomasi dokumen berbasis AI yang menghilangkan kebutuhan pra-pelatihan dan memungkinkan penerapan instan. Platform ini menawarkan akurasi tinggi dalam klasifikasi dan ekstraksi, meningkat secara berkelanjutan melalui koreksi pengguna, dengan rencana untuk peningkatan di masa mendatang.

GateNews19jam yang lalu

American Express Akan Mengakuisisi Startup Pengeluaran Berbasis AI Hyper pada Q2 2026

American Express akan mengakuisisi startup AI Hyper untuk meningkatkan alat manajemen pengeluarannya bagi klien komersial. Akuisisi ini, yang diperkirakan selesai pada Q2 2026, menyusul kemitraan yang meluncurkan kartu imbalan berlogo bersama pada 2024.

GateNews20jam yang lalu
Komentar
0/400
Tidak ada komentar