Gate 新聞訊息,4月24日——DeepSeek V4 已發布來自正式數學推理評估的結果,在 Putnam-2025 中取得滿分 120/120,與 Axiom 並列第一名。
在使用 LeanExplore 與受約束取樣的實務模式下,V4-Flash-Max 在 Putnam-200 Pass@8 基準中得分 81.00,顯著優於 Seed-2.0-Prover (35.50)、Gemini 3 Pro (26.50) 以及 Seed-1.5-Prover (26.50)。前沿模式的結果顯示,V4 領先於 Seed-1.5-Prover (110/120) 與 Aristotle (100/120)。
V4 採用混合型「正式—非正式推理」方法:非正式推理產生候選自然語言解答,自我驗證會篩選結果,而正式代理在 Lean 中完成嚴格證明。前沿模式結果使用了大規模計算規模化,而實務模式分數更能反映標準部署能力。
免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見
聲明。
相關文章
Meta Platforms 將於 5 月 20 日裁減 10% 員工,影響約 8,000 個職位
Gate News 訊息,4 月 24 日——Meta Platforms 計劃在 5 月 20 日前裁減約 10% 的員工,影響約 8,000 個職位。裁員旨在提升營運效率,同時增加對人工智慧的投資。
所規劃的重組反映了
GateNews34分鐘前
川普政府公布打擊 AI 提煉計劃,控中企系統性竊取模型能力
白宮科技政策辦公室(OSTP)總統助理邁克爾·J·克拉齊奧斯(Michael J. Kratsios)於 4 月 23 日發表官方聲明,表示川普政府掌握信息,顯示外國實體(主要位於中國)正在蓄意針對美國大型人工智慧公司,透過「數萬個代理帳戶」及越獄技術系統性提取美國 AI 模型能力,並同步公布四項應對措施。
Market Whisper56分鐘前
DeepSeek 推出 V4 開源預覽版,技術評分 3206 超越 GPT-5.4
DeepSeek 於 4 月 24 日正式推出 V4 預覽版系列,以 MIT 許可協議開源,模型權重已同步上線 Hugging Face 及 ModelScope。根據 DeepSeek V4 技術報告,V4-Pro-Max(最高推理力度模式)在 Codeforces 基準取得 3206 分,超越 GPT-5.4。
Market Whisper1小時前
寒武紀完成 DeepSeek-V4 的第 0 天適配,為中國 AI 晶片生態系樹立里程碑
Gate News 訊息,4 月 24 日——寒武紀(Cambricon)今天宣布,已使用其專有 NeuWare 軟體生態系與 vLLM 框架完成 DeepSeek-V4 的第 0 天(Day 0)適配。DeepSeek-V4 是 DeepSeek 最新的大型語言模型。適配程式碼同時開源,標誌著
GateNews1小時前
騰訊開源 Hy3 預覽版,程式碼基準測試較前代提升 40%
騰訊於 4 月 23 日在 GitHub、Hugging Face 及 ModelScope 平台正式開源 Hy3 預覽版大型語言模型,並同步於騰訊雲端(Tencent Cloud)提供付費 API 服務。據 Decrypt 於 4 月 24 日報導,Hy3 預覽版自 1 月下旬啟動訓練,至發布日歷時不足三個月。
Market Whisper1小時前
如果未破產,FTX 投資組合價值 158 兆韓元
FTX 這家集中式加密貨幣交易所因流動性短缺與資金外流,於 2022 年 11 月申請第 11 章破產保護;根據 Park 引用的分析,如果它沒有倒閉,本應持有約 158.796 兆韓元的投資價值。
Crypto Frontier1小時前