Ramp Labs mengajukan solusi baru untuk berbagi memori antar-multiagen, konsumsi Token tertinggi turun 65%

GateNews

Berita Gerbang, 11 April, perusahaan infrastruktur AI Ramp Labs merilis hasil riset “Latent Briefing”, yang memungkinkan berbagi memori yang efisien antar sistem multi-agen dengan mengompresi langsung cache KV dari model besar. Dengan tidak mengorbankan akurasi, konsumsi Token diturunkan secara signifikan. Dalam arsitektur multi-agen arus utama, orkestrator (Orchestrator) memecah tugas dan berulang kali memanggil model pekerja (Worker); seiring rantai penalaran terus diperpanjang, jumlah Token meningkat secara eksponensial. Gagasan inti dari Latent Briefing adalah menggunakan mekanisme atensi untuk mengidentifikasi bagian konteks yang benar-benar penting, lalu membuang informasi redundan langsung pada level representasi, bukan mengandalkan ringkasan LLM yang lambat atau penelusuran RAG yang kurang stabil. Pada pengujian benchmark LongBench v2, metode ini menunjukkan performa yang menonjol: konsumsi Token model Worker turun 65%, penghematan Token untuk dokumen berukuran menengah (32k hingga 100k) mencapai median 49%, akurasi keseluruhan meningkat sekitar 3 poin persentase dibanding baseline, sementara waktu tambahan untuk setiap kompresi hanya sekitar 1,7 detik—lebih cepat kira-kira 20 kali dibanding algoritma asli. Eksperimen menggunakan Claude Sonnet 4 sebagai orkestrator dan Qwen3-14B sebagai model pekerja, mencakup skenario dokumen beragam seperti makalah akademik, dokumen hukum, novel, serta laporan pemerintah. Penelitian juga menemukan bahwa ambang kompresi optimal berbeda tergantung tingkat kesulitan tugas dan panjang dokumen—masalah yang sulit cocok untuk kompresi yang agresif guna menyaring kebisingan penalaran yang bersifat spekulatif, sementara dokumen panjang lebih cocok untuk kompresi ringan guna mempertahankan informasi kunci yang tersebar.

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Artikel Terkait

Agen Hermes AI sumber terbuka hadir, memiliki memori jangka panjang dan dapat menggantikan OpenClaw

Nous Research merilis kerangka open-source AI Agent Hermes Agent, dengan mekanisme memori jangka panjang berbasis SQLite dan arsitektur evolusi mandiri, serta mendukung migrasi satu klik memori dan skill dari OpenClaw. Proses instalasi mencakup sembilan langkah, untuk memastikan keamanan dapat dijalankan melalui isolasi lingkungan menggunakan Docker. Selain itu, Hermes Agent mendukung penerapan model lokal, cocok untuk pengguna yang mengutamakan privasi data.

MarketWhisper3jam yang lalu

Aethir Claw Memungkinkan Agen AI Menjalankan Alur Kerja Kreatif

Aethir Claw adalah platform cloud GPU terdesentralisasi yang memungkinkan agen AI Designer otonom untuk pembuatan konten, merevolusi cara AI menghasilkan visual dan media tanpa permintaan manusia. Platform ini meningkatkan skalabilitas, otomatisasi, dan kreativitas dalam produksi digital.

BlockChainReporter4jam yang lalu

CIA Membiarkan AI Menulis Laporan Intelijen Pertamanya—Dan “Rekan Kerja” AI Akan Menyusul Berikutnya

Singkatnya Wakil Direktur CIA Michael Ellis mengonfirmasi bahwa lembaga tersebut menghasilkan laporan intelijen sepenuhnya berbasis AI pertama kalinya. Ellis menguraikan peta jalan untuk “rekan kerja” AI dalam alur kerja analis—dan dalam satu dekade, petugas yang mengelola tim agen AI. Pengungkapan ini datang ketika CIA

Decrypt5jam yang lalu

Jurnal penelitian Universitas California: AI router agen memiliki kerentanan serius, mencuri 26 kredensial enkripsi secara diam-diam

Penelitian Universitas California mengungkap kerentanan keamanan dalam rantai pasokan model bahasa besar (LLM), khususnya serangan man-in-the-middle berbahaya yang mungkin dilakukan oleh router pihak ketiga. Penelitian menemukan 26 router menyuntikkan perintah berbahaya, mencuri kredensial dan data sensitif. Pengguna sulit menyadari batas antara pemrosesan kredensial dan pencurian, dan “mode YOLO” memperburuk risiko keamanan. Penelitian menyarankan agar pengembang memisahkan operasi yang sensitif dan memilih layanan router yang memiliki audit transparan untuk meningkatkan perlindungan.

MarketWhisper5jam yang lalu

BEAT (Audiera) naik 25,26% dalam 24 jam

Berita Pintu, 13 April, menurut data Gate, per saat rilis, BEAT (Audiera) kini diperdagangkan pada 0.3717 dolar AS, naik 25.26% dalam 24 jam terakhir, dengan harga tertinggi menyentuh 0.4159 dolar AS dan terendah kembali ke 0.2801 dolar AS. Volume perdagangan 24 jam mencapai 10.001 juta dolar AS. Kapitalisasi pasar saat ini sekitar 51.77 juta dolar AS. Audiera ($BEAT) menciptakan sistem ekonomi partisipatif yang berpusat pada agen, menjadikan manusia dan agen AI otonom sebagai peserta yang setara. Agen dapat memiliki dompet, menghasilkan pendapatan dan melakukan pengeluaran di rantai, membuat musik, serta berpartisipasi dalam pertarungan ritme—bukan lagi sekadar alat. Ekosistem ini didukung oleh $BEAT yang dideploy di BNB Chain, digunakan untuk mekanisme insentif dan berbagi kemakmuran. Di Audiera

GateNews6jam yang lalu

Claude Code menambahkan loop dinamis: AI secara otomatis menentukan ritme pemantauan, berkembang dari polling menjadi berbasis peristiwa

Claude Code menambahkan fitur loop dinamis, memungkinkan pengguna saat menjalankan perintah agar AI secara otomatis menentukan interval pemeriksaan, sehingga mengubah pola polling tetap tradisional. Dengan dukungan alat Monitor, Claude dapat melakukan pemantauan yang digerakkan peristiwa, tanpa perlu pemeriksaan yang sering, sehingga secara signifikan meningkatkan efisiensi pemantauan dan cocok untuk berbagai jenis tugas. Fitur ini menunjukkan bahwa Anthropic terus mengembangkan Claude Code menjadi sistem operasi kerja pengembang yang lengkap.

ChainNewsAbmedia14jam yang lalu
Komentar
0/400
Tidak ada komentar