《Wall Street Journal》 survei terbaru mengungkapkan bahwa krisis pasokan komputasi untuk industri AI telah sepenuhnya meledak; sewa spot Blackwell GPU dalam dua bulan terakhir melonjak dari $2,75 per jam menjadi $4,08 per jam, kenaikannya 48%; tingkat eksekusi normal API Claude milik Anthropic selama 90 hari hanya 98,95%, jauh di bawah standar perusahaan 99,99%, yang telah menyebabkan pelanggan korporat seperti Retool pindah haluan ke OpenAI.
(Pembukaan: raksasa short seller Michael Burry melontarkan pernyataan: Palantir hanyalah perusahaan outsourcing SaaS dengan margin laba rendah! Anthropic sedang memakannya)
(Tambahan latar: Claude lipat-ganda penggunaan gratis! Anthropic menjalankan promo terbatas waktu, pengguna Taiwan hampir merasakan manfaatnya sepanjang hari)
Daftar Isi
Toggle
Seluruh dunia sudah kehabisan komputasi; termasuk sewa spot untuk Blackwell GPU yang naik 48% dalam dua bulan, serta orang-orang yang melihat layar Claude Code berhenti pada thinking…; semuanya sekarang sangat kekurangan.
Indeks Harga Komputasi (Ornn Compute Price Index, OCPI) yang dirilis Ornn baru-baru ini telah dimasukkan ke dalam Bloomberg Terminal, sehingga investor institusi sekarang dapat memantau dinamika sewa spot GPU secara real-time, seperti mengikuti harga minyak.
Faktor inti yang mendorong kenaikan harga ini adalah ledakan permintaan untuk Agentic AI (AI berbasiskan agen). AI tidak lagi sekadar fungsi tanya-jawab pada antarmuka web; melainkan memerlukan pekerjaan otonom yang berlangsung lama dan terus-menerus, dan “selera” terhadap komputasi berada pada skala yang benar-benar berbeda. Pasokan komputasi belum naik, namun permintaannya lebih dulu meledak.
CEO Vultr J.J. Kardwell mengatakannya dengan terus terang: “Ini adalah kekurangan komputasi paling parah yang pernah saya lihat selama lebih dari lima tahun mengelola perusahaan ini. Siklus pembangunan pusat data terlalu panjang; seluruh listrik yang bisa digunakan pada tahun 2026 sudah dipesan habis.” Perhatikan ia berbicara soal “listrik”, bukan “chip”.
Kemacetan komputasi tahun 2026 sudah tidak lagi berada pada lini produksi GPU, melainkan pada jaringan listrik; pusat data sedang menunggu listrik.
Dalam 90 hari hingga 8 April, tingkat eksekusi normal Claude API adalah 98,95%; standar perusahaan yang berlaku di industri adalah 99,99%. Selisihnya 1,04 poin persentase terdengar kecil, tetapi sebenarnya berarti tambahan hampir 8 jam waktu downtime setiap bulan.
Perusahaan yang menghubungkan AI ke alur kerja inti tidak bisa menerima ini (seolah-olah pengguna biasa saja pun harus menerimanya).
Pendiri sekaligus CEO Retool David Hsu memberikan satu kalimat yang kemungkinan membuat Anthropic merasa malu: “Saya pikir Opus 4.6 adalah model perusahaan terbaik, tetapi pada akhirnya kami pindah ke OpenAI, karena Anthropic terus mengalami down.”
Retool adalah platform pengembangan perangkat lunak untuk perusahaan, pelanggan yang paling dibutuhkan Anthropic, tetapi order tetap terbang karena kekurangan komputasi.
Anthropic mulai menerapkan pembatasan laju (rate limiting) pada akhir Maret; Senin sampai Jumat dari pukul 5 pagi hingga 11 pagi waktu Pasifik, membatasi konsumsi token pengguna. Dan pada pertengahan Maret, lebih awal lagi, Anthropic juga meluncurkan promo “penggandaan penggunaan pada jam sepi”, yang mendorong pengguna Taiwan menghindari jam sibuk. Sekarang setelah dilihat kembali, promo itu bukan sedang membagikan keuntungan, melainkan mengalihkan arus lalu lintas ke jam sepi agar kapasitas di jam puncak kosong.
Kami melihat pertumbuhan pendapatan tahunan (ARR) Anthropic yang sangat mengesankan: pada akhir 2025 adalah $90 miliar, tahun ini bulan Februari melonjak ke $140 miliar, dan pada bulan April sudah menembus $300 miliar. Semakin banyak untung, semakin memprihatinkan, karena pendapatan baru di baliknya berarti kebutuhan komputasi yang lebih besar; celah pasokan makin lebar.
Volume pemrosesan token API OpenAI pada Oktober 2025 adalah 6 miliar per menit; pada akhir Maret tahun ini sudah menjadi 15 miliar per menit. Dalam lima bulan naik dua setengah kali—bukan karena model makin kuat, tetapi karena penggunaan meledak dengan kecepatan yang keterlaluan.
Chief Financial Officer Sarah Friar berkata: “Saya menghabiskan banyak waktu untuk mencari sedikit komputasi yang masih tersedia di mana-mana; kami sedang melakukan keputusan yang sangat menyakitkan. Ada beberapa proyek yang karena kurang komputasi akhirnya dibatalkan.”
Jadi kita tahu Sora ditutup: OpenAI menurunkan aplikasi pembuatan video itu dari platform, dan sebagian alasannya adalah mengalihkan sumber daya chip yang terlepas ke alat pemrograman dan produk perusahaan.
CoreWeave menaikkan sewa lebih dari 20% pada akhir tahun lalu, sekaligus meminta pelanggan menengah dan kecil menandatangani kontrak minimal tiga tahun—sebelumnya hanya setahun. Bagi startup baru dan perusahaan menengah yang membutuhkan fleksibilitas, itu sama saja dengan sedang “mengusir orang”.
Namun untuk pelanggan besar, CoreWeave punya skema yang berbeda. Pada 10 April tahun ini, CoreWeave baru saja mengumumkan kesepakatan bertahun-tahun dengan Anthropic: memungkinkan Anthropic mengakses komputasi GPU Nvidia di pusat data Amerika. Anthropic berjanji untuk mengerahkan skala komputasi hingga maksimal 1 GW (1 gigawatt), dengan menggunakan hardware Nvidia Grace Blackwell dan generasi berikutnya Vera Rubin.
Artikel Terkait
Pendiri Ethereum Lubin: AI Akan Menjadi Titik Balik Penting untuk Kripto, Tapi Monopoli Raksasa Teknologi Menimbulkan Risiko Sistemik
Elon Musk Mendorong Cek “Pendapatan Tinggi Universal” sebagai Solusi Utama untuk Pengangguran Akibat AI
DeepSeek Dilaporkan Meluncurkan Putaran Penggalangan Dana Eksternal Pertama, Menargetkan Valuasi $10B+ dan $300M+
Iklan ChatGPT masuk ke Australia dan Selandia Baru: Free dan pengguna Go lebih dulu, paket berbayar tetap tanpa iklan
Hyundai Motor Group Mengorganisasi Ulang Berpusat pada AI dan Robotika, Menargetkan 30.000 Robot Atlas pada 2030
NEA mengeksplorasi penggunaan kecerdasan buatan dalam regulasi nuklir