Anthropic Merilis Claude Opus 4.7 dengan Kapabilitas Siber yang Melemah

CryptoFrontier

Anthropic merilis versi yang ditingkatkan dari model andalannya, Claude Opus 4.7, pada 16 April (waktu setempat). Dibandingkan dengan model Opus 4.6 sebelumnya, Opus 4.7 menunjukkan “peningkatan signifikan” pada kapabilitas rekayasa perangkat lunak tingkat lanjut, terutama untuk tugas-tugas yang sulit, dengan ketelitian dan konsistensi yang ditingkatkan dalam operasi kompleks yang berjalan lama serta kemampuan visi yang lebih baik. Namun, Anthropic sengaja melemahkan kapabilitas serangan-pertahanan siber model selama pelatihan dan memperkenalkan mekanisme keselamatan untuk secara otomatis mendeteksi serta memblokir permintaan yang dilarang atau berisiko tinggi.

Kinerja dan Tolok Ukur

Dalam pengujian tolok ukur, Opus 4.7 meraih skor yang umumnya lebih tinggi daripada Opus 4.6 sebelumnya dan GPT-5.4 pesaing. Namun, Anthropic menekankan bahwa kapabilitas keseluruhan Opus 4.7 tidak sebanding dengan model paling kuat perusahaan, Claude Mythos Preview. Menurut Anthropic: “Dengan menerapkan dan mengoperasikan mekanisme perlindungan ini di dunia nyata, kami akan mengumpulkan pengalaman untuk akhirnya memungkinkan rilis lebih luas model level Mythos.”

Deployment dan Penetapan Harga

Opus 4.7 kini aktif di seluruh produk Claude dan antarmuka API, terintegrasi dengan layanan Amazon Bedrock, Google Cloud Vertex AI, dan Microsoft Foundry. Harga tetap konsisten dengan Opus 4.6: $5 per juta token input dan $25 per juta token output.

Perubahan Konsumsi Token

Dua perubahan pada Opus 4.7 dibandingkan Opus 4.6 akan memengaruhi penggunaan token. Pertama, Opus 4.7 menggunakan tokenizer yang diperbarui, yang meningkatkan cara model memproses teks. Namun, ini berarti input yang identik dapat mengonsumsi lebih banyak token—sekitar 1 hingga 1,35 kali konsumsi generasi sebelumnya.

Kedua, Opus 4.7 melakukan penalaran lebih banyak pada intensitas “thinking” yang lebih tinggi, khususnya pada putaran berikutnya dalam skenario agen. Ini meningkatkan keandalan untuk masalah kompleks tetapi menghasilkan token keluaran tambahan.

Token consumption increase visualization Peningkatan konsumsi token Opus 4.7. Sumber: Anthropic

Analisis Pasar dan Konteks

Para analis mengkarakterisasi Opus 4.7 sebagai model “transisi”. Analis investasi Adam Button mencatat bahwa rilis Opus 4.7 memperkuat narasi Anthropic tentang “model-model godlike” seperti Mythos dan mengonfirmasi keraguan pasar: model berbayar yang tersedia untuk publik pada dasarnya adalah versi “lite” yang dibatasi oleh mekanisme keselamatan.

Latar Belakang Perusahaan dan Tonggak Keuangan

Anthropic, yang didirikan pada 2021 oleh mantan karyawan OpenAI, mengembangkan rangkaian model bahasa besar Claude. Pada 6 April, Anthropic mengumumkan pendapatannya (ARR) melebihi $300 miliar, peningkatan signifikan dibanding $9 miliar pada akhir 2025. Perusahaan ini sedang aktif mengejar penawaran umum perdana.

Kekhawatiran Risiko Keamanan Siber

Eksekutif Anthropic berulang kali memperingatkan dampak AI terhadap keamanan siber. Menurut laporan yang bertanggal 10 April (waktu setempat), Menteri Keuangan AS Yellen dan Ketua Federal Reserve Powell mengadakan pertemuan darurat dengan pemimpin Wall Street pada 7 April untuk membahas bagaimana model AI Mythos terbaru Anthropic dapat meningkatkan risiko keamanan siber. Anthropic telah menyatakan bahwa Mythos tidak cocok untuk rilis publik karena model tersebut berpotensi disalahgunakan oleh penjahat siber dan mata-mata. Perusahaan ini memberikan akses ke Mythos secara selektif kepada perusahaan-perusahaan terkemuka global di bidang keamanan siber dan perangkat lunak.

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Artikel Terkait

Tiongkok Akan Menguji 300+ Robot Humanoid di Paruh Maraton Beijing pada 19 April

Maraton setengah robot paruh kedua Beijing menampilkan lebih dari 300 robot humanoid dari 70 tim yang bertanding di lintasan 21 km. Kemajuan dalam pergerakan otonom disorot, dengan 40% beroperasi tanpa kendali. Tiongkok mendominasi pasar robot humanoid, meski menghadapi tantangan produksi.

GateNews3menit yang lalu

AS Ingin Meningkatkan Impor Uranium Namibia untuk Menjalankan Pembangkit Nuklir Berbasis AI

AS sedang mempertimbangkan peningkatan impor uranium dari Namibia untuk mendukung energi nuklir bagi pusat data AI, sementara Tiongkok mendominasi sektor uranium Namibia. Kenaikan harga uranium menghidupkan kembali minat pertambangan, meskipun ada tantangan pasokan air di kawasan yang gersang.

GateNews13menit yang lalu

Para Eksekutif OpenAI Bill Peebles dan Kevin Weil Berpamitan dalam Penataan Ulang Kepemimpinan

Para eksekutif OpenAI, Bill Peebles dan Kevin Weil, mengumumkan pengunduran diri mereka, sebagai bagian dari serangkaian perubahan kepemimpinan saat perusahaan mendesentralisasi operasinya. Kepergian mereka menyusul beberapa pengunduran diri berprofil tinggi lainnya serta pergeseran dalam struktur perusahaan.

GateNews1jam yang lalu

Zoom Bermitra dengan World untuk Menambahkan Deteksi Deepfake Menggunakan Pengenalan Wajah

Zoom telah bermitra dengan World milik Sam Altman untuk meluncurkan fitur yang mendeteksi peserta sebenarnya vs deepfake AI selama panggilan video. Ini bertujuan untuk memerangi penipuan deepfake yang kian meningkat, dengan opsi verifikasi untuk tuan rumah dan peserta.

GateNews1jam yang lalu

Laporan Bug yang Dihasilkan AI Membanjiri Tim Pemelihara cURL

Laporan bug yang dihasilkan AI membanjiri proyek cURL, dengan peningkatan substansial pada jumlah pengajuan yang menyebabkan beban sumber daya. Para pemelihara merespons dengan membatasi akses model AI dan menghentikan program imbalan kerentanan untuk mengelola lonjakan tersebut.

GateNews2jam yang lalu

xAI Meluncurkan API Speech-to-Text dan Text-to-Speech untuk Grok

xAI meluncurkan API speech-to-text dan text-to-speech untuk platform Grok-nya, memungkinkan pengembang mengintegrasikan interaksi suara alami ke dalam aplikasi. Pembaruan ini meningkatkan pengalaman pengguna dan aksesibilitas untuk berbagai kebutuhan penggunaan.

GateNews2jam yang lalu
Komentar
0/400
StargazingWithAMirroredSpherevip
· 17jam yang lalu
Dari 4.6 ke 4.7 disebut sebagai "significant", tidak tahu seberapa besar peningkatannya dalam debugging rantai panjang, refactoring, dan cakupan pengujian?
Lihat AsliBalas0
OrangePeelRadiovip
· 19jam yang lalu
Minta tolong: Apakah mungkin menemukan semua bug tersembunyi dalam PR yang kompleks sekaligus? Jangan hanya menulis demo kecil.
Lihat AsliBalas0
BlackVelvetBluePeonyvip
· 19jam yang lalu
Anthropic ritme ini agak keras, Claude sekarang semakin mirip "insinyur tingkat tinggi" daripada chatbot.
Lihat AsliBalas0
ReminderOfWavesCrashingAgainstvip
· 19jam yang lalu
Peningkatan kemampuan rekayasa perangkat lunak sangat penting, tugas tingkat basis kode adalah medan perang yang sesungguhnya.
Lihat AsliBalas0
StargazingUnderTheGlassDomevip
· 19jam yang lalu
4.7 Akhirnya datang, menantikan pengujian langsung.
Lihat AsliBalas0
GateUser-5d719abavip
· 19jam yang lalu
Semoga bukan lagi kenaikan skor dari daftar peringkat, dalam proyek nyata begitu ada konflik dependensi atau masalah lingkungan langsung gagal.
Lihat AsliBalas0
TheWaveOfRasterizationvip
· 19jam yang lalu
Saya lebih peduli dengan keandalan panggilan alat dan perubahan multi-file: apakah dapat mempertahankan konsistensi, dan tidak menyebabkan kerusakan di satu tempat saat memperbaiki di tempat lain.
Lihat AsliBalas0
StrollingOnTheEdgeOfTheDaovip
· 19jam yang lalu
Menunggu komunitas membandingkan kinerja SWE GPT/DeepSeek, terutama navigasi gudang besar, penentuan isu, dan kecepatan pengiriman end-to-end.
Lihat AsliBalas0
BluePeonyObservervip
· 19jam yang lalu
4.7 "peningkatan ketelitian" terdengar seperti lebih berhati-hati, mungkin akan lebih sedikit mengarang API? Ini sangat penting.
Lihat AsliBalas0
Lihat Lebih Banyak