DeepSeek V4 запускається з вікном контексту 1M; чипи Huawei Ascend і Cambricon досягають повної сумісності

Повідомлення Gate News, 24 квітня — DeepSeek V4-Pro і DeepSeek V4-Flash були офіційно випущені та відкрито передані в open-source 24 квітня, причому довжина контекстного опрацювання суттєво розширена з 128K до 1M, що відповідає майже 10-кратному зростанню місткості. Huawei Computing оголосила, що її продукти Ascend supernode повністю підтримують моделі серії DeepSeek V4 завдяки тісній співпраці між технологіями чипа та моделі.

Ascend 950 забезпечує розгортання інференсу моделей DeepSeek V4 із високою пропускною здатністю та низькою затримкою завдяки технікам злитого ядра та багатопотокової паралельності, щоб зменшити накладні витрати на обчислення Attention і доступ до пам’яті. Для DeepSeek V4-Pro із входом 8K Ascend 950 досягає приблизно 20ms TPOT із 4,700 TPS пропускної здатності Decode на одну карту; для DeepSeek V4-Flash за входу до 8K він досягає приблизно 10ms TPOT із пропускною здатністю 1,600 TPS. Серія супервузлів Ascend A3 також досягає повної сумісності: надано опорні реалізації для тренування для швидкого фінастройнінгу. На основі супервузла Ascend A3 на 64 карти з великим режимом EP, DeepSeek V4-Flash досягає понад 2,000 TPS пропускної здатності Decode на одну карту в сценаріях вхід-вихід 8K/1K за допомогою рушія інференсу vLLM. Повні лінійки продуктів Huawei Ascend A2, A3 і 950 підтримують як DeepSeek V4-Flash, так і V4-Pro.

Huawei Cloud оголосила про сумісність першою серед конкурентів із DeepSeek V4, надаючи розробникам сервіси API token в один клік через свою платформу MaaS. Huawei Cloud оптимізувала можливості системного рівня, рівня операторів і рівня кластерів, щоб забезпечити швидку адаптацію моделей та високопродуктивне розгортання. Підприємства, зокрема Kingsoft WPS і 360, уже інтегрували нову модель DeepSeek через Huawei Cloud.

Cambricon також оголосила про сумісність Day 0 з DeepSeek V4-Flash і V4-Pro на основі фреймворка інференсу vLLM, при цьому код адаптації відкрито передано в open-source для спільноти GitHub. Раніше Cambricon досягла адаптації першою серед конкурентів, коли DeepSeek V3.2 було випущено торік; тоді було проведено глибоку оптимізацію продуктивності у співпраці програмного та апаратного забезпечення для моделей серії DeepSeek.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

Google ПЛАНУЄ ІНВЕСТУВАТИ ДО $40 БІЛЬЯРА В ANTHROPIC, ОБІЦЯЄ 5+ ГІГАВАТ ПОТУЖНОСТІ ДЛЯ ОБЧИСЛЕНЬ

Повідомлення Gate News, 24 квітня — За даними ринкових джерел, Google планує інвестувати до $40 мільярда в Anthropic. Інвестиція розпочнеться з початкових $10 мільярда грошима, а потім — до додаткових $30 мільярда за умови досягнення визначених етапів. Google також надасть Anthropic щонайменше 5 гігават потужності для обчислень у межах партнерства.

GateNews44хв. тому

Швейцарський регулятор FINMA попереджає, що інструмент AI Anthropic Mythos створює фінансовий ризик

Повідомлення Gate News, 24 квітня — Федеральне управління фінансового нагляду Швейцарії (FINMA) заявило, що дозвіл банкам швидко й зручно впровадити інструмент штучного інтелекту Anthropic Mythos створюватиме серйозні ризики для

GateNews1год тому

Fere AI завершує раунд фінансування на $1.3 млн, очолений Ethereal Ventures

Повідомлення Gate News, 24 квітня — Fere AI, платформа для торгових агентів цифровими активами на основі ШІ, оголосила про завершення раунду фінансування на $1.3 млн, який очолила Ethereal Ventures; також участь взяли Galaxy Vision Hill і Kosmos Ventures. Платформа підтримує міжланцюгові мережі, зокрема Ethereum,

GateNews2год тому

Anthropic відкотила зміни в Claude Code після падіння якості; усі виправлення завершено

Повідомлення Gate News, 24 квітня — Anthropic визнав нещодавнє погіршення якості Claude Code та підтвердив, що всі пов’язані проблеми вирішено за допомогою відкатів і виправлень. Проблеми виникли через три зміни продукту й підказок, внесені в період між початком і серединою квітня. 4 березня

GateNews3год тому

Співзасновник NeoSoul Каелан: Індустрія ШІ має дозволяти існування «іграшок», інновації часто стартують як експериментальні продукти

Повідомлення Gate News, 24 квітня — На нещодавньому форумі в Гонконзі з інтелектуальних зашифрованих фінансів співзасновник NeoSoul Каелан поділився міркуваннями щодо оцінювання проєктів ШІ на ранній стадії, в галузі ШІ, що швидко розвивається. Окрім оцінки наявних продуктів, команди мають продемонструвати здатність не відставати від можливостей базової моделі, сказав він.

GateNews4год тому

Meta розгорне десятки мільйонів чипів AWS Graviton5 у багаторічній угоді на мільярди доларів

Повідомлення Gate News, 24 квітня — Meta підписала багаторічну угоду з Amazon Web Services, щоб розгорнути десятки мільйонів процесорів Graviton5 для своєї інфраструктури ШІ, зробивши Meta одним із найбільших клієнтів AWS Graviton у всьому світі. Угода, розрахована на три–п’ять років, оцінюється в мільярди доларів, за даними

GateNews4год тому
Прокоментувати
0/400
Немає коментарів