PANews 2月27日消息,据Cointelegraph报道,开源AI实验室Sentient宣布推出Arena,这是一个用于评估AI代理在企业级工作流程中表现的生产级测试环境。Pantera Capital和Franklin Templeton的数字资产部门已加入Arena的首批测试队列。
Sentient表示,Arena并非静态模型测试,而是通过模拟包含长文档、不完整信息和冲突来源的企业条件,对AI代理进行标准化任务测试。平台会跟踪幻觉、证据缺失、引用错误和推理漏洞等失败类别,帮助开发者诊断问题。Arena计划通过公开排行榜发布对比性能指标,并发布总结常见失败模式和修复方案的测试报告。
免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見
聲明。
相關文章
「史上最大的商業詐欺」:杜羅夫抨擊 WhatsApp 加密 - U.Today
Telegram 執行長 Pavel Durov 批評 WhatsApp 疑似誤導用戶關於其加密的做法,並聲稱存在「後門」,讓第三方能夠存取私人訊息。他將此與 Telegram 的隱私標準作對比,並表示 WhatsApp 欺騙了數十億人。
UToday34分鐘前
抗量子威脅!業界提比特幣錢包救援工具、無須軟分叉QSB方案
比特幣社群針對量子電腦破解風險,近期提出兩大防禦方案:Lightning Labs的救援工具可在不洩露種子的情況下證明錢包所有權;StarkWare的量子安全比特幣(QSB)則在不變動核心協議下,利用雜湊函數增強交易安全性。這些技術有助於提升比特幣應對未來風險的韌性。
CryptoCity54分鐘前
Nunchuk 推出開源比特幣工具,供具「有界權限」的 AI 代理使用
簡要說明
Nunchuk 發布了兩款開源工具,旨在讓 AI 代理在嚴格限制下與比特幣錢包互動。
該系統使用共享錢包與核准政策,確保代理無法在既定規則之外動用資金。
這些工具的目標是支援自動化的金融任務,同時確保資金使用符合規範
Decrypt 6小時前
Circle 發布互聯網金融系統願景:聚焦跨鏈互通、流動性編排與機構級資產發行
Circle 於 4 月 10 日發布 2026 年互聯網金融發展願景,計劃建構跨鏈互操作基礎設施,以提高資金流動性和資產發行能力。未來將推出秒級結算功能並擴展至更多資產,同時簡化多鏈操作流程,提升使用者體驗。
GateNews8小時前
SBI Ripple Asia 推出基於 XRPL 的代幣發行
SBI Ripple Asia 推出了 XRP Ledger 平台,可在日本的法規架構下,讓受監管的預付代幣得以發行與使用。
API 可將區塊鏈整合到既有應用程式中,讓代幣使用更順暢,無需重新設計使用者介面。
平台面向現實世界的支付,提供快速、低成本
CryptoFrontNews9小時前