根據 Nvidia 最新部落格分析,Blackwell GPU 的每小時成本相較於 Hopper 世代近乎翻倍,但每個 token 的推論成本則可低 35 倍。以 DeepSeek-R1 作為測試模型,Blackwell(GB300 NVL72)租用每張 GPU 每小時為 2.65 美元,而 Hopper 為 1.41 美元;然而單顆 GPU 的吞吐量則從每秒 90 個 token 大幅提升到每秒 6,000 個 token。這 65 倍的吞吐提升使得每百萬個 token 成本從 4.20 美元降至 0.12 美元。
0.12 美元這個數字假設已完成完整軟體最佳化,包括 FP4 低精度推論與多 token 預測(MTP)。若未啟用 MTP,每百萬個 token 成本約可達 2.35 美元;啟用後則降至 0.11 美元,顯示僅靠該功能本身就帶來 21 倍的最佳化效果。
免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見
聲明。
相關文章
Forefront Tech 完成 $100M 的 IPO 定價,將在 Nasdaq 上市
根據 ChainCatcher,Forefront Tech Holdings Acquisition Corp 在 4 月 30 日完成 1 億美元 IPO 定價,預計以代號 FTHAU 在那斯達克上市。所得款項將用於探索區塊鏈、人工智慧、金融科技及其他領域的併購機會
GateNews30分鐘前
前 Meta 高層為 AI 初創公司 Flourish 籌集資金,估值 25 億美元
根據 Bloomberg,曾領導 Meta「Neural Band」相關工作的前 Meta 高層 Thomas Reardon 正在為 Flourish 募資,這是一家新的 AI 初創公司,專注於低功耗 AI 系統。Lux Capital 與 Google Ventures 已同意成為主要投資人,支持者目前已承諾 5 億美元,估值在 $2.5
GateNews32分鐘前
OpenAI 將哥布林問題追溯到書呆子個性獎勵訊號,哥布林提到 GPT-5.1 中飆升 175%
根據 OpenAI 的說法,該公司已找出從 GPT-5.1 之後開始困擾 GPT 模型的「goblin」問題的根本原因。用於強化「Nerdy」人格特質的獎勵訊號,鼓勵產出包含奇幻生物的引用,而訓練資料集中有 76.2% 的內容顯示
GateNews1小時前
平行網路系統以 $100M 估值完成 $2B Series B 輪融資,由 Sequoia 領投
根據 TechCrunch,Parallel Web Systems(由前 Twitter 執行長 Parag Agrawal 創立的 AI 新創公司)在 Sequoia 領投的一輪 B 融資中,以 20 億美元估值籌集了 1 億美元。本輪融資使公司的總融資額達到 2.3 億美元,距其 1 億美元的 A 輪融資僅過了五個月。Parallel
GateNews1小時前
BitMart 幣市 8 週年晚宴:為台灣用戶導入 AI 自動化交易與在地化服務
BitMart 幣市於台北君品舉辦8週年晚宴,超過150位嘉賓出席,回顧八年發展並宣布在地化與 AI 自動交易策略。 BitMart Skill 結合 Blave,讓用戶無需程式即可透過 AI 自動交易並取得即時數據洞察。全球用戶突破 1300 萬、上線項目超過 4800、交易量逾 1 萬億美元。晚宴設有真人財神爺與豐厚禮品,展現深耕台灣的決心。
鏈新聞abmedia1小時前
軟銀計畫 2026 年上市 Roze,估值目標 1000 億美元
根據《金融時報》(FT)於 4 月 30 日獨家報道,軟銀(SoftBank)正計畫在美國拆分成立一家全新獨立公司,名為 Roze,業務涵蓋 AI 機器人與資料中心基礎設施,目標最快於 2026 年完成 IPO,估值目標定於 1,000 億美元。《金融時報》同時報道,軟銀內部對估值目標及 IPO 時間表存在疑慮。
Market Whisper2小時前