Kapasitas komputasi sampai bikin menangis! WSJ: Sewa Blackwell naik 48% dalam dua bulan, Anthropic terlalu lambat hingga perusahaan pindah haluan

《Wall Street Journal》 survei terbaru mengungkapkan bahwa krisis pasokan komputasi untuk industri AI telah sepenuhnya meledak; sewa spot Blackwell GPU dalam dua bulan terakhir melonjak dari $2,75 per jam menjadi $4,08 per jam, kenaikannya 48%; tingkat eksekusi normal API Claude milik Anthropic selama 90 hari hanya 98,95%, jauh di bawah standar perusahaan 99,99%, yang telah menyebabkan pelanggan korporat seperti Retool pindah haluan ke OpenAI.
(Pembukaan: raksasa short seller Michael Burry melontarkan pernyataan: Palantir hanyalah perusahaan outsourcing SaaS dengan margin laba rendah! Anthropic sedang memakannya)
(Tambahan latar: Claude lipat-ganda penggunaan gratis! Anthropic menjalankan promo terbatas waktu, pengguna Taiwan hampir merasakan manfaatnya sepanjang hari)

Daftar Isi

Toggle

  • Anthropic adalah yang paling buruk
  • OpenAI mencari komputasi ke mana-mana, akhirnya menutup Sora
  • CoreWeave harus mencari pelanggan besar untuk menandatangani angka astronomi, sambil mengusir pelanggan menengah dan kecil

Seluruh dunia sudah kehabisan komputasi; termasuk sewa spot untuk Blackwell GPU yang naik 48% dalam dua bulan, serta orang-orang yang melihat layar Claude Code berhenti pada thinking…; semuanya sekarang sangat kekurangan.

Indeks Harga Komputasi (Ornn Compute Price Index, OCPI) yang dirilis Ornn baru-baru ini telah dimasukkan ke dalam Bloomberg Terminal, sehingga investor institusi sekarang dapat memantau dinamika sewa spot GPU secara real-time, seperti mengikuti harga minyak.

Faktor inti yang mendorong kenaikan harga ini adalah ledakan permintaan untuk Agentic AI (AI berbasiskan agen). AI tidak lagi sekadar fungsi tanya-jawab pada antarmuka web; melainkan memerlukan pekerjaan otonom yang berlangsung lama dan terus-menerus, dan “selera” terhadap komputasi berada pada skala yang benar-benar berbeda. Pasokan komputasi belum naik, namun permintaannya lebih dulu meledak.

CEO Vultr J.J. Kardwell mengatakannya dengan terus terang: “Ini adalah kekurangan komputasi paling parah yang pernah saya lihat selama lebih dari lima tahun mengelola perusahaan ini. Siklus pembangunan pusat data terlalu panjang; seluruh listrik yang bisa digunakan pada tahun 2026 sudah dipesan habis.” Perhatikan ia berbicara soal “listrik”, bukan “chip”.

Kemacetan komputasi tahun 2026 sudah tidak lagi berada pada lini produksi GPU, melainkan pada jaringan listrik; pusat data sedang menunggu listrik.

Anthropic adalah yang paling buruk

Dalam 90 hari hingga 8 April, tingkat eksekusi normal Claude API adalah 98,95%; standar perusahaan yang berlaku di industri adalah 99,99%. Selisihnya 1,04 poin persentase terdengar kecil, tetapi sebenarnya berarti tambahan hampir 8 jam waktu downtime setiap bulan.

Perusahaan yang menghubungkan AI ke alur kerja inti tidak bisa menerima ini (seolah-olah pengguna biasa saja pun harus menerimanya).

Pendiri sekaligus CEO Retool David Hsu memberikan satu kalimat yang kemungkinan membuat Anthropic merasa malu: “Saya pikir Opus 4.6 adalah model perusahaan terbaik, tetapi pada akhirnya kami pindah ke OpenAI, karena Anthropic terus mengalami down.”

Retool adalah platform pengembangan perangkat lunak untuk perusahaan, pelanggan yang paling dibutuhkan Anthropic, tetapi order tetap terbang karena kekurangan komputasi.

Anthropic mulai menerapkan pembatasan laju (rate limiting) pada akhir Maret; Senin sampai Jumat dari pukul 5 pagi hingga 11 pagi waktu Pasifik, membatasi konsumsi token pengguna. Dan pada pertengahan Maret, lebih awal lagi, Anthropic juga meluncurkan promo “penggandaan penggunaan pada jam sepi”, yang mendorong pengguna Taiwan menghindari jam sibuk. Sekarang setelah dilihat kembali, promo itu bukan sedang membagikan keuntungan, melainkan mengalihkan arus lalu lintas ke jam sepi agar kapasitas di jam puncak kosong.

Kami melihat pertumbuhan pendapatan tahunan (ARR) Anthropic yang sangat mengesankan: pada akhir 2025 adalah $90 miliar, tahun ini bulan Februari melonjak ke $140 miliar, dan pada bulan April sudah menembus $300 miliar. Semakin banyak untung, semakin memprihatinkan, karena pendapatan baru di baliknya berarti kebutuhan komputasi yang lebih besar; celah pasokan makin lebar.

OpenAI mencari komputasi ke mana-mana, akhirnya menutup Sora

Volume pemrosesan token API OpenAI pada Oktober 2025 adalah 6 miliar per menit; pada akhir Maret tahun ini sudah menjadi 15 miliar per menit. Dalam lima bulan naik dua setengah kali—bukan karena model makin kuat, tetapi karena penggunaan meledak dengan kecepatan yang keterlaluan.

Chief Financial Officer Sarah Friar berkata: “Saya menghabiskan banyak waktu untuk mencari sedikit komputasi yang masih tersedia di mana-mana; kami sedang melakukan keputusan yang sangat menyakitkan. Ada beberapa proyek yang karena kurang komputasi akhirnya dibatalkan.”

Jadi kita tahu Sora ditutup: OpenAI menurunkan aplikasi pembuatan video itu dari platform, dan sebagian alasannya adalah mengalihkan sumber daya chip yang terlepas ke alat pemrograman dan produk perusahaan.

CoreWeave harus mencari pelanggan besar untuk menandatangani angka astronomi, sambil mengusir pelanggan menengah dan kecil

CoreWeave menaikkan sewa lebih dari 20% pada akhir tahun lalu, sekaligus meminta pelanggan menengah dan kecil menandatangani kontrak minimal tiga tahun—sebelumnya hanya setahun. Bagi startup baru dan perusahaan menengah yang membutuhkan fleksibilitas, itu sama saja dengan sedang “mengusir orang”.

Namun untuk pelanggan besar, CoreWeave punya skema yang berbeda. Pada 10 April tahun ini, CoreWeave baru saja mengumumkan kesepakatan bertahun-tahun dengan Anthropic: memungkinkan Anthropic mengakses komputasi GPU Nvidia di pusat data Amerika. Anthropic berjanji untuk mengerahkan skala komputasi hingga maksimal 1 GW (1 gigawatt), dengan menggunakan hardware Nvidia Grace Blackwell dan generasi berikutnya Vera Rubin.

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Artikel Terkait

Pendiri Ethereum Lubin: AI Akan Menjadi Titik Balik Penting untuk Kripto, Tapi Monopoli Raksasa Teknologi Menimbulkan Risiko Sistemik

Pendiri Ethereum Joseph Lubin menekankan potensi transformatif AI bagi sektor kripto sambil mengingatkan risiko sentralisasi di antara raksasa teknologi. Ia membayangkan transaksi otonom yang digerakkan oleh AI di blockchain dan menyoroti konvergensi keuangan tradisional dengan DeFi.

GateNews1jam yang lalu

Elon Musk Mendorong Cek “Pendapatan Tinggi Universal” sebagai Solusi Utama untuk Pengangguran Akibat AI

Elon Musk menganjurkan Universal High Income untuk melawan pengangguran akibat AI, membayangkan masa depan dengan barang-barang yang melimpah dan nol inflasi. Sebaliknya, para ahli seperti Sam Altman mengangkat kekhawatiran tentang hilangnya pekerjaan dan mengusulkan langkah-langkah perlindungan bagi pekerja.

Coinpedia1jam yang lalu

DeepSeek Dilaporkan Meluncurkan Putaran Penggalangan Dana Eksternal Pertama, Menargetkan Valuasi $10B+ dan $300M+

DeepSeek, sebuah startup AI asal Tiongkok, sedang menegosiasikan putaran pendanaan eksternal pertamanya, dengan target minimal $300 juta pada valuasi $10 miliar. Meski sebelumnya menolak penawaran investasi, kini pembicaraan penggalangan dananya dilaporkan sudah berlangsung.

GateNews1jam yang lalu

Iklan ChatGPT masuk ke Australia dan Selandia Baru: Free dan pengguna Go lebih dulu, paket berbayar tetap tanpa iklan

OpenAI pada 17 April 2023 memperluas iklan ChatGPT ke Australia, Selandia Baru, dan Kanada, untuk pengguna Free dan Go; pengguna berbayar tidak memiliki iklan. Langkah ini menandai jalur kedua komersialisasi AI, sekaligus mempertimbangkan risiko bisnis dan regulasi; kehadiran iklan dapat mendorong konversi berbayar.

ChainNewsAbmedia3jam yang lalu

Hyundai Motor Group Mengorganisasi Ulang Berpusat pada AI dan Robotika, Menargetkan 30.000 Robot Atlas pada 2030

Grup Hyundai Motor melakukan restrukturisasi untuk fokus pada AI dan robotika, mengurangi operasi tradisional. Grup ini berencana berinvestasi sebesar $34,3 miliar pada robotika pada 2030 dan menargetkan peluncuran model robotics-as-a-service, bekerja sama dengan Google DeepMind dan NVIDIA.

GateNews6jam yang lalu

NEA mengeksplorasi penggunaan kecerdasan buatan dalam regulasi nuklir

Kelompok Kerja NEA tentang Teknologi Baru mengadakan lokakarya pada 25–26 Maret, dengan fokus pada bagaimana kecerdasan buatan dapat diterapkan untuk pengawasan peraturan dan operasi internal di dalam otoritas nuklir. Ringkasan Lokakarya NEA mengeksplorasi penerapan AI di dunia nyata dalam regulasi nuklir, dengan

Cryptonews9jam yang lalu
Komentar
0/400
Tidak ada komentar