Hugging Face 開放原始碼 ml-intern:用於自主式 ML 研究的 AI 代理

Gate News 訊息,4 月 22 日——Hugging Face 已開源 ml-intern,這是一款 ML 研究代理,能夠自主完成整個工作流程:閱讀論文、整理資料集、啟動 GPU 訓練、評估結果,並持續迭代改進。該專案基於 Hugging Face 的 smolagents 框架,並提供 CLI 與網頁式介面,程式碼可在 GitHub 上取得。

ml-intern 工具鏈以 Hugging Face 生態系為核心。它從 arXiv 與 HF Papers 擷取論文,同時追蹤引用鏈以便進行更深入的閱讀;在 HF Hub 上瀏覽資料集、驗證品質,並重新格式化資料以用於訓練;當本地 GPU 資源不可用時,會呼叫 HF Jobs 來啟動基於雲端的訓練任務。訓練完成後,代理會自動閱讀評估輸出、診斷失敗原因,並重新執行實驗。預設情況下,它使用 Claude Sonnet 4.5 來驅動決策迴圈,每次執行最多 300 次迭代;當超過 170k tokens 時,會自動進行情境壓縮。

Hugging Face 展示了三個使用案例。在科學推理任務中,該代理透過引用鏈找出 OpenScience 與 NemoTron-CrossThink 資料集,並根據難度等級從 ARC、SciQ 與 MMLU 篩選出 7 個變體;接著在 Qwen3-1.7B 上進行 12 輪的監督式微調,使 GPQA 分數在 10 小時內從 10% 提升到 32%。在醫療應用中,該代理判定既有資料集不足,撰寫腳本以生成 1,100 個合成資料樣本,並將其擴增 50 倍用於訓練;在 HealthBench 上,其效能超過 Codex 60%。在競賽型數學情境中,該代理編寫了 GRPO 訓練腳本,並透過 HF Spaces 在 A100 GPU 上啟動訓練;隨後在觀察到獎勵崩潰後進行了消融研究。

免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明

相關文章

微軟推出 AI 代理商務基礎設施:出版商市場、商家協議與廣告工具

Gate News 訊息,4 月 22 日——微軟的 AI 變現副總裁 Tim Frank 宣布一系列面向「agentic web」時代的商業基礎設施更新,使出版商、商家和廣告商能在 AI 代理代表使用者做出購買決策時,持續保持可被發現且可被交易。

GateNews44分鐘前

NeoCognition 以 $40M 種子資金募集推動在職學習的 AI 代理

Gate News 訊息,4 月 22 日—AI 研究實驗室 NeoCognition 宣布完成一輪 $40 百萬種子輪融資,並從保密模式中浮出水面。該公司由俄亥俄州立大學副教授 Yu Su,以及 Xiang Deng 和 Yu Gu 共同創立,總部位於加州帕洛阿爾托。該輪融資

GateNews1小時前

PicWe 推出具備裝置端金鑰管理的 AI 代理錢包

PicWe 宣布推出 PicWe Wallet 的公開測試版,這是一款由 AI 代理驅動、可在裝置端運作的金鑰錢包,且不使用復原助記詞。它支援多鏈資產、代幣交換(swap)、AI 可存取的自動化,並旨在整合 RWA 基礎設施。 PicWe 已推出 PicWe Wallet 的公開測試版;這是一款由 AI 代理(AI Agent)賦能的錢包,會將金鑰儲存在裝置端,取消復原助記詞,並讓關鍵操作保持在本地進行。該測試版支援多鏈資產管理、代幣交換(swaps),以及以穩定幣為基礎的費用支付,同時透過可程式化的 AI 互動來實現更靈活的鏈上操作。更廣泛的 PicWe 方案將該平台定位為真實世界資產(RWA)的統一基礎設施,使發行、流通、結算、跨境付款、代幣化,以及針對企業用例的供應鏈協調得以涵蓋在內。

GateNews1小時前

Google Research 發布 ReasoningBank:AI 代理從成功與失敗中學習推理策略

Gate 新聞訊息,4 月 22 日 — Google Research 發布 ReasoningBank:一種代理記憶框架,可讓由大型語言模型驅動的代理在部署後持續學習。該框架從成功與失敗的任務經驗中提取通用推理策略,並將其

GateNews2小時前

清華教授戴繼豐推出 Naive.ai,融資約 $300M ,估值 $800M

Gate 新聞訊息,4月22日——清華大學電子工程系副教授戴繼豐創立了 Naive.ai,一家專注於開源模型的後訓練與 AI 代理的公司。該創業公司已融資約 $300 百萬,估值約為 80

GateNews3小時前

AWS 擴大全多代理 AI 工作流程,支援在 Bedrock 上使用 Claude Opus 4.7

Gate News 訊息,4 月 22 日 — Amazon Web Services 宣布透過多代理(multi-agent)工作流程擴大其 agentic AI(代理式 AI)計畫,支援在 Amazon Bedrock 上使用 Anthropic 的 Claude Opus 4.7,協助客戶超越生成式 AI 試點。隨著客戶從「

GateNews3小時前
留言
0/400
暫無留言