Gate Newsメッセージ、4月24日—DeepSeekは本日V4モデルカードをリリースし、昨日リリースされたTileKernelsカーネルライブラリの分析を通じて行われた先行するアーキテクチャ予測を検証しました (4月23日)。Beatingによるモニタリングによれば、3つの主要コンポーネントが確認されました: mHC (Manifold-Constrained Hyper-Connections)がByteDanceの元のHyperConnectionに代わり、Top-kエキスパートルーティングによるMoEアーキテクチャ、そしてFP4+FP8の混合精度による重みストレージ。予測されていたEngram条件付きメモリモジュールは、モデルカードには登場しませんでした。
モデルカードでは、TileKernelsではカバーされていなかった新しいコンポーネントが明らかになりました: ハイブリッド注意機構 (CSA + HCA)がV4の長文脈効率の向上を促し、推論FLOPsを、1Mコンテキストウィンドウ時でV3.2の水準のわずか27%まで、KVキャッシュを10%まで引き下げます。学習では現在Muonオプティマイザを使用しています。
この検証は、プロダクションレベルのカーネル実装が、公式仕様が公表される前に基礎となるモデルアーキテクチャを明らかにし得ることを示しています。
免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は
免責事項をご参照ください。
関連記事
TencentがオープンソースしたHy3プレビュー版は、コードベンチマークテストで前世代比40%向上
テンセントは4月23日にGitHub、Hugging Face、ModelScopeの各プラットフォームで、Hy3のプレビュー版の大規模言語モデルを正式にオープンソースとして公開し、あわせてテンセントクラウド(Tencent Cloud)でも有料APIサービスを提供している。Decryptが4月24日に報じたところによれば、Hy3プレビュー版は1月下旬にトレーニングを開始し、公開カレンダー時点では3か月に満たない。
MarketWhisper6分前
破綻していなければ 158 兆ウォン相当の FTX ポートフォリオ投資額
FTXは、流動性不足と資本流出により2022年11月に連邦破産法第11章(Chapter 11)の適用を申請した中央集権型暗号資産取引所であり、崩壊していなければ約158.796兆ウォン相当の投資を保有していたはずだと、パク氏が引用した分析によれば述べられている
CryptoFrontier9分前
XiaomiがMiMo-V2-Proの学習詳細を公開:1Tモデルパラメータ、数千のGPUを投入
Gate Newsメッセージ、4月24日――Xiaomiの大規模言語モデルチームリードであるロウ・フーリが、詳細なインタビューの中で、MiMo-V2-Proモデルは合計1兆パラメータを持ち、学習には数千のGPUが必要だったことを明らかにした。彼女は、1T規模は、Claude Opus 4.6に近い性能を達成し、次の段階のAIエージェントに向けた競争力のある参加チケットを確保するための最低ラインだと述べた。
GateNews23分前
DeepSeek V4がPutnam-2025で満点を達成、形式的な数学推論でAxiomと首位
Gate Newsメッセージ、4月24日 — DeepSeek V4は、形式的な数学的推論の評価結果を公開し、Putnam-2025で満点の120/120を達成し、首位でAxiomと並びました。
LeanExploreと制約付きサンプリングを用いた実用レジームでは、V4-Flash-Maxは「に」に81.00を獲得しました。
GateNews31分前
どのようなAIが最も身分や地位を際立たせますか?調査で、Claudeユーザーの収入が同業を大きく上回り、Meta AIが底辺に位置することが判明
Epoch AI の調査によると、Claude ユーザーは主に高所得層で、80%が年収 10 万ドル超です。Meta AI の収入分布は最も幅広く、10 万ドル以上が 36.5%で、低所得層の割合が最も高いです。Claude は価格が上昇し、階層別の課金になっているため、コストが増える可能性があります。Meta は導入がより容易です。将来、どの AI が暗黙のアイデンティティ指標になり得るのでしょうか。
ChainNewsAbmedia36分前
V4-Pro、内部ドッグフーディングテストで67%のコーディング合格率を達成。Opus 4.5の性能に接近
ゲートニュース、4月24日 — V4はV4-Proモデルについて、内部ドッグフーディングのデータを公表しました。同社は、50人超のエンジニアから約200件の実世界のエンジニアリング課題を収集し、PyTorch、CUDA、Rust、C++を含む技術スタック全体にわたる機能開発、バグ修正、リファクタリング、診断をカバーしています。
GateNews50分前