Peringatan DeepMind: enam jenis serangan siber dapat membajak agen AI, perusahaan perlu meningkatkan perlindungan

Berita Gate: Para peneliti Google DeepMind memperingatkan bahwa lingkungan internet yang terbuka berpotensi dimanfaatkan untuk membajak agen-agen AI otonom dan memanipulasi perilakunya. Laporan berjudul “Artificial Intelligence Agent Trap” menyatakan bahwa ketika perusahaan menerapkan agen AI untuk menjalankan tugas nyata, penyerang juga dapat melakukan serangan yang ditargetkan melalui jaringan. Penelitian mengidentifikasi enam jenis risiko utama, termasuk jebakan injeksi konten, jebakan manipulasi semantik, jebakan status kognitif, jebakan kontrol perilaku, jebakan sistem, serta jebakan interaksi manusia-mesin.

Jebakan injeksi konten adalah yang paling langsung: penyerang dapat menempatkan instruksi di komentar HTML, metadata, atau elemen halaman yang tersembunyi; setelah agen membacanya, instruksi tersebut dapat dieksekusi. Jebakan manipulasi semantik bekerja dengan memuat ungkapan otoritatif atau menyamarkannya sebagai halaman web yang menyerupai lingkungan penelitian, lalu diam-diam memengaruhi pemahaman agen terhadap tugas, bahkan kadang mampu melewati mekanisme keamanan. Jebakan status kognitif dilakukan dengan menyisipkan data palsu ke sumber informasi agen, sehingga dalam jangka panjang ia keliru menganggap informasi tersebut telah diverifikasi. Jebakan kontrol perilaku menargetkan tindakan aktual agen, dan dapat mendorongnya untuk mengakses data sensitif serta mengirimkannya ke tujuan eksternal.

Jebakan sistem melibatkan manipulasi terkoordinasi lintas beberapa sistem AI, yang dapat memicu efek berantai, mirip seperti kejatuhan pasar mendadak akibat perdagangan algoritmik. Jebakan interaksi manusia-mesin memanfaatkan tahap peninjauan oleh manusia: dengan membuat konten tinjauan yang tampak kredibel, perilaku berbahaya dapat lolos dari pengawasan.

Untuk menghadapi risiko tersebut, DeepMind menyarankan penggabungan pelatihan adversarial, penyaringan input, pemantauan perilaku, dan sistem reputasi konten jaringan, serta membangun kerangka tanggung jawab hukum yang lebih jelas. Namun, penelitian menyebutkan bahwa industri masih belum memiliki standar pertahanan yang seragam, dan langkah-langkah yang ada cenderung terpecah-pecah serta tidak terfokus. Penelitian menyerukan agar pengembang dan perusahaan memperhatikan keamanan lingkungan operasional agen AI, serta mencegah potensi risiko manipulasi dan penyalahgunaan jaringan.

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Artikel Terkait

Rhea Finance mengalami serangan dari Oracle dan rugi 18,40 juta dolar AS: ZachXBT memberi peringatan, Tether membekukan 4,34 juta USDT, penyerang mengembalikan sebagian dana

Rhea Finance mengalami serangan manipulasi Oracle di NEAR Protocol, dengan kerugian mencapai 18,40 juta dolar AS, dua kali lebih besar dari perkiraan awal. Penyerang memanipulasi kuotasi token palsu, sehingga terjadi kesalahan penilaian nilai agunan. Tether membekukan 4,34 juta USDT, penyerang mengembalikan sekitar 3,50 juta dolar AS, dan hingga kini dana yang berhasil dipulihkan melebihi 7,80 juta dolar AS, yang menegaskan pentingnya keamanan Oracle.

ChainNewsAbmedia29menit yang lalu

DNS eth.limo Diserang, Vitalik Mendesak Pengguna untuk Menunda Akses dan Beralih ke IPFS

Vitalik Buterin memperingatkan pada 18 April tentang serangan terhadap pencatat DNS untuk eth.limo, mendesak pengguna untuk menghindari mengakses vitalik.eth.limo dan halaman terkait. Ia menyarankan menggunakan IPFS sebagai alternatif sampai masalah tersebut terselesaikan.

GateNews37menit yang lalu

Bursa Tersanksi Grinex Diserang Peretasan $13,7 Juta; Menyalahkan Layanan Intelijen Asing

Grinex, bursa kripto-ruble yang dikenai sanksi, telah menghentikan operasinya karena serangan siber yang mencuri lebih dari $13.74 juta dalam USDT. Serangan tersebut diduga melibatkan aktor tingkat negara yang bertujuan untuk mengganggu sistem keuangan Rusia. Grinex bekerja sama dengan penegak hukum, tetapi tidak memiliki jadwal waktu untuk memulai kembali layanan.

Coinpedia8jam yang lalu

Figure Menghadapi Tuduhan Short Seller Terkait Klaim Integrasi Blockchain; Saham FIGR Turun 53% Dari Puncak Januari

Figure Technology Solutions menghadapi tuduhan dari Morpheus Research karena melebih-lebihkan penggunaan teknologinya berbasis blockchain, yang menyebabkan penurunan signifikan pada harga saham. Figure membela operasinya, menyoroti fitur aset digital dan metrik kinerja yang kuat.

GateNews15jam yang lalu

Penipu Kripto asal Houston Divonis 23 Tahun untuk Skema $20M Meta-1 Coin

Robert Dunlap, seorang pengusaha asal Houston, dijatuhi hukuman 23 tahun penjara karena penipuan kripto $20 juta yang melibatkan aset palsu dan praktik menipu, yang berdampak pada lebih dari 1.000 korban. Kasusnya mencerminkan meningkatnya kejahatan siber terkait kripto secara lebih luas.

GateNews20jam yang lalu

SlowMist Memperingatkan Serangan Phishing Aktif Menggunakan Perangkat Lunak Palsu "Harmony Voice"

Tim keamanan SlowMist telah memperingatkan adanya kampanye social engineering yang menargetkan pengguna mata uang kripto. Para penipu berpura-pura sebagai mitra proyek untuk menipu pengguna agar mengunduh aplikasi berbahaya yang disamarkan sebagai alat penerjemahan. Pengguna disarankan untuk memverifikasi keaslian perangkat lunak.

GateNews21jam yang lalu
Komentar
0/400
Tidak ada komentar