Ramp Labs đề xuất một giải pháp mới để chia sẻ trí nhớ giữa nhiều tác nhân, mức tiêu thụ Token cao nhất giảm 65%

Tin Gate News, ngày 11 tháng 4, công ty cơ sở hạ tầng AI Ramp Labs công bố kết quả nghiên cứu “Latent Briefing”, đạt được chia sẻ bộ nhớ hiệu quả giữa các hệ đa tác tử thông qua việc nén trực tiếp bộ nhớ đệm KV của mô hình lớn, đồng thời giảm mạnh mức tiêu thụ Token mà không làm mất chính xác. Trong các kiến trúc đa tác tử phổ biến, bộ điều phối (Orchestrator) tách nhỏ nhiệm vụ và liên tục gọi đi gọi lại mô hình làm việc (Worker); khi chuỗi suy luận ngày càng kéo dài, lượng Token tăng theo cấp số nhân. Ý tưởng cốt lõi của Latent Briefing là sử dụng cơ chế chú ý để nhận diện phần thực sự quan trọng trong ngữ cảnh, rồi loại bỏ thông tin dư thừa ngay ở lớp biểu diễn, thay vì dựa vào bản tóm tắt của LLM vốn chậm hoặc truy xuất RAG kém ổn định. Trong bài kiểm thử chuẩn LongBench v2, phương pháp này thể hiện ấn tượng: lượng Token tiêu thụ của mô hình Worker giảm 65%, mức tiết kiệm Token cho các tài liệu độ dài trung bình (32k đến 100k) đạt trung vị 49%, độ chính xác tổng thể tăng khoảng 3 điểm phần trăm so với đường cơ sở, trong khi thời gian phát sinh cho mỗi lần nén chỉ khoảng 1,7 giây, nhanh hơn thuật toán gốc khoảng 20 lần. Thí nghiệm sử dụng Claude Sonnet 4 làm bộ điều phối và Qwen3-14B làm mô hình làm việc, bao phủ nhiều kịch bản tài liệu như bài báo học thuật, văn bản pháp lý, tiểu thuyết và báo cáo của chính phủ. Nghiên cứu cũng phát hiện rằng ngưỡng nén tối ưu thay đổi theo độ khó của nhiệm vụ và độ dài tài liệu—các bài toán khó phù hợp với nén mạnh để lọc nhiễu suy luận mang tính đầu cơ, còn tài liệu dài thì phù hợp hơn với nén nhẹ để lưu giữ các thông tin then chốt được phân tán.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

Nous Research Phân tích sâu: Phòng thí nghiệm AI phi tập trung của Paradigm đặt cược định giá 1 tỷ, phân tích toàn diện mô hình Hermes và mạng lưới Psyche

Nous Research là một phòng thí nghiệm AI mã nguồn mở, tập trung vào các mô hình thuộc dòng Hermes, và vào năm 2025 đã nhận được 50 triệu đô la đầu tư từ Paradigm, với định giá đạt 1 tỷ. Điểm độc đáo của họ là phát triển công nghệ AI bởi một đội ngũ crypto native rồi tích hợp lại với blockchain. Sản phẩm cốt lõi là mô hình Hermes được thiết kế dựa trên ý tưởng giảm tỷ lệ bị từ chối, và nguồn dữ liệu chủ yếu là dữ liệu tổng hợp. Đồng thời, Psyche Network xây dựng một mạng lưới huấn luyện AI phi tập trung trên Solana, khuyến khích người tham gia thông qua cơ chế token. Nous Research theo đuổi chiến lược mã nguồn mở và phi tập trung, nhằm thể hiện năng lực công nghệ và tính khả thi của mình.

ChainNewsAbmedia2giờ trước

Byreal ra mắt trợ lý giao dịch AI trên chuỗi RealClaw, hỗ trợ mở rộng kỹ năng của bên thứ ba

Byreal đã ra mắt trợ lý giao dịch AI trên chuỗi RealClaw vào ngày 13 tháng 4, công cụ này dựa trên khung OpenClaw, hỗ trợ mở rộng kỹ năng của bên thứ ba, người dùng có thể tự tùy chỉnh chiến lược giao dịch, hiện đang ở giai đoạn thử nghiệm Alpha và chỉ mở cho người dùng được mời.

GateNews6giờ trước

Astriax Nhận $50M Đầu tư từ Paradigm để Thúc đẩy Giao dịch Dẫn dắt Bởi AI

Astriax đã huy động thành công khoản $50M đầu tư từ Paradigm, định vị mình là một đơn vị dẫn đầu trong giao dịch on-chain do AI thúc đẩy. Quan hệ hợp tác này giúp củng cố uy tín của các tổ chức trong DeFi, tập trung vào thực thi tự động và phân tích nâng cao để tối ưu hóa các chiến lược giao dịch và cải thiện công tác quản lý thanh khoản.

BlockChainReporter7giờ trước

Ra mắt tác nhân AI mã nguồn mở Hermes Agent, có trí nhớ dài hạn và có thể thay thế OpenClaw

Nous Research phát hành khung AI Agent mã nguồn mở Hermes Agent, có cơ chế ghi nhớ dài hạn dựa trên SQLite và kiến trúc tự tiến hóa, hỗ trợ di chuyển chỉ bằng một lần bộ nhớ và kỹ năng của OpenClaw. Quá trình cài đặt bao gồm chín bước, đảm bảo an toàn có thể thực thi trong môi trường được cách ly bằng Docker. Ngoài ra, Hermes Agent hỗ trợ triển khai mô hình tại chỗ, phù hợp với người dùng coi trọng quyền riêng tư dữ liệu.

MarketWhisper12giờ trước

Aethir Claw cho phép tác nhân AI thực thi các quy trình làm việc sáng tạo

Aethir Claw là một nền tảng đám mây GPU phi tập trung cho phép các tác nhân AI Designer tự chủ để tạo nội dung, cách mạng hóa cách AI tạo hình ảnh và phương tiện truyền thông mà không cần lời nhắc của con người. Nó nâng cao khả năng mở rộng, tự động hóa và sự sáng tạo trong sản xuất kỹ thuật số.

BlockChainReporter13giờ trước

CIA để AI viết báo cáo tình báo đầu tiên của mình—và các “đồng nghiệp” của AI sẽ là người tiếp theo

Tóm lại Thứ trưởng CIA, Michael Ellis, xác nhận cơ quan đã tạo ra báo cáo tình báo hoàn toàn do AI tạo ra lần đầu tiên. Ellis phác thảo lộ trình cho các “đồng nghiệp” AI trong quy trình làm việc của nhà phân tích—và trong vòng một thập kỷ, các sĩ quan quản lý các nhóm tác nhân AI. Thông tin công bố này đã xuất hiện khi CIA

Decrypt14giờ trước
Bình luận
0/400
Không có bình luận