DeepSeek V4 ra mắt với cửa sổ ngữ cảnh 1M; chip Huawei Ascend và Cambricon đạt tương thích hoàn toàn

Tin Gate News, ngày 24 tháng 4 — DeepSeek V4-Pro và DeepSeek V4-Flash đã được phát hành chính thức và công bố mã nguồn mở vào ngày 24 tháng 4; độ dài xử lý theo ngữ cảnh được mở rộng đáng kể từ 128K lên 1M, tương đương mức tăng dung lượng gần gấp 10 lần. Huawei Computing cho biết các sản phẩm siêu điểm nút (supernode) Ascend của họ hỗ trợ đầy đủ các mô hình thuộc dòng DeepSeek V4 thông qua sự hợp tác chặt chẽ giữa công nghệ chip và công nghệ mô hình.

Huawei Ascend 950 đạt triển khai suy luận mô hình DeepSeek V4 với thông lượng cao và độ trễ thấp nhờ các kỹ thuật kernel hợp nhất (fused kernel) và song song đa luồng (multi-stream parallelism) nhằm giảm chi phí tính toán Attention và chi phí truy cập bộ nhớ. Đối với DeepSeek V4-Pro với đầu vào 8K, Ascend 950 đạt khoảng 20ms TPOT với thông lượng Decode 4,700 TPS trên một thẻ đơn; đối với DeepSeek V4-Flash với đầu vào dưới 8K, nó đạt khoảng 10ms TPOT với thông lượng 1,600 TPS. Dòng siêu điểm nút (supernode) Ascend A3 cũng đạt tương thích hoàn toàn, kèm theo các triển khai mã huấn luyện mẫu để tinh chỉnh nhanh. Dựa trên siêu điểm nút 64 thẻ Ascend A3 với chế độ EP lớn, DeepSeek V4-Flash đạt hơn 2,000 TPS thông lượng Decode trên một thẻ đơn trong các tình huống đầu vào/đầu ra 8K/1K bằng cách sử dụng công cụ suy luận vLLM. Toàn bộ các dòng sản phẩm Huawei Ascend A2, A3 và 950 đều hỗ trợ cả DeepSeek V4-Flash và V4-Pro.

Huawei Cloud công bố khả năng tương thích theo phương thức “đi trước” với DeepSeek V4, cung cấp cho nhà phát triển dịch vụ token API chỉ với một lần nhấp thông qua nền tảng MaaS của họ. Huawei Cloud đã tối ưu năng lực của lớp hệ thống (system layer), lớp toán tử (operator layer) và lớp cụm (cluster layer) để đảm bảo thích nghi nhanh mô hình và triển khai hiệu năng cao. Các doanh nghiệp bao gồm Kingsoft WPS và 360 đã tích hợp mô hình mới của DeepSeek thông qua Huawei Cloud.

Cambricon cũng công bố tương thích “Day 0” với DeepSeek V4-Flash và V4-Pro dựa trên khung suy luận vLLM, đồng thời mã thích nghi được công bố mã nguồn mở cho cộng đồng GitHub. Cambricon trước đó cũng đã đạt khả năng thích nghi theo phương thức “đi trước” khi DeepSeek V3.2 được phát hành vào năm ngoái, nhờ đã thực hiện tối ưu hóa hiệu năng sâu về phần mềm-hardware (phần mềm–phần cứng) đồng tác giữa các mô hình thuộc dòng DeepSeek.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

Google Dự Kiến Đầu Tư Tối Đa $40 Tỷ USD vào Anthropic, Cam Kết Hơn 5 Gigawatt Năng Lực Tính Toán

Tin tức Cổng, ngày 24 tháng 4 — Theo các nguồn tin thị trường, Google dự định đầu tư lên tới $40 tỷ USD vào Anthropic. Khoản đầu tư sẽ bắt đầu với $10 tỷ USD tiền mặt ban đầu, sau đó là tối đa thêm $30 tỷ USD tùy thuộc vào việc đạt được các mốc thành tựu được quy định. Google cũng sẽ cung cấp cho Anthropic

GateNews36phút trước

Cơ quan quản lý Thụy Sĩ FINMA cảnh báo rằng công cụ AI Mythos của Anthropic có nguy cơ gây rủi ro tài chính

Tin tức từ Gate, ngày 24 tháng 4 — Cơ quan Giám sát Thị trường Tài chính (FINMA) của Thụy Sĩ đã cho biết việc cho phép các ngân hàng nhanh chóng và thuận tiện áp dụng công cụ trí tuệ nhân tạo Mythos của Anthropic sẽ gây ra những rủi ro nghiêm trọng cho

GateNews59phút trước

Fere AI Hoàn Tất Vòng Gọi Vốn 1,3 Triệu USD Được Dẫn Dắt Bởi Ethereal Ventures

Tin tức từ Gate, ngày 24 tháng 4 — Fere AI, một nền tảng tác nhân giao dịch tài sản kỹ thuật số được hỗ trợ bởi AI, đã công bố hoàn tất vòng gọi vốn trị giá 1,3 triệu USD do Ethereal Ventures dẫn dắt, với Galaxy Vision Hill và Kosmos Ventures tham gia. Nền tảng hỗ trợ các mạng xuyên chuỗi bao gồm Ethereum,

GateNews2giờ trước

Anthropic Hoàn Nguyên Thay Đổi Claude Code Sau Khi Chất Lượng Suy Giảm; Tất Cả Các Sửa Chữa Đã Xong

Tin tức Cổng, ngày 24 tháng 4 — Anthropic đã thừa nhận sự sụt giảm gần đây về chất lượng của Claude Code và xác nhận rằng tất cả các vấn đề liên quan đã được khắc phục thông qua các lần hoàn nguyên (rollbacks) và sửa lỗi. Các vấn đề bắt nguồn từ ba điều chỉnh về sản phẩm và lời nhắc (prompt) được thực hiện trong giai đoạn từ đầu đến giữa tháng 4. Vào ngày 4 tháng 3, the

GateNews3giờ trước

Đồng sáng lập NeoSoul Kaelan: Ngành AI nên cho phép sự tồn tại của đồ chơi, đổi mới thường bắt đầu từ các sản phẩm thử nghiệm

Tin tức Gate, ngày 24 tháng 4 — Tại một diễn đàn gần đây ở Hồng Kông về tài chính mã hóa thông minh, đồng sáng lập NeoSoul Kaelan đã chia sẻ những hiểu biết về việc đánh giá các dự án AI ở giai đoạn đầu, trong ngành AI phát triển nhanh chóng và liên tục thay đổi. Ngoài việc đánh giá các sản phẩm hiện tại, các nhóm phải chứng minh khả năng bắt kịp với các năng lực của mô hình nền tảng, ông cho biết. Kaelan nhấn mạnh rằng khởi nghiệp AI cần cả sự vững nền và tầm nhìn: vững nền nghĩa là có năng lực về triển khai kỹ thuật, thiết kế sản phẩm và hiểu biết thị trường để tạo ra các sản phẩm hữu hình; tầm nhìn nghĩa là xây dựng phù hợp với các xu hướng phát triển của các mô hình ngôn ngữ lớn. Kaelan lập luận rằng dù một số sản phẩm AI giai đoạn đầu có thể trông như đồ chơi, những hình thức như vậy nên được cho phép trong các ngành công nghiệp đang hình thành. Nhiều mô hình hoàn toàn mới thực sự lần đầu tiên xuất hiện dưới dạng sản phẩm thử nghiệm trước khi đạt đến độ trưởng thành.

GateNews4giờ trước

Meta sẽ triển khai hàng chục triệu chip AWS Graviton5 trong thỏa thuận đa năm trị giá hàng tỷ đô la

Tin tức Gate, ngày 24 tháng 4 — Meta đã ký một thỏa thuận nhiều năm với Amazon Web Services để triển khai hàng chục triệu bộ xử lý Graviton5 cho cơ sở hạ tầng AI của mình, khiến Meta trở thành một trong những khách hàng Graviton lớn nhất của AWS trên toàn cầu. Thỏa thuận này kéo dài từ ba đến năm năm, được định giá lên tới hàng tỷ đô la, theo Phó Chủ tịch AWS Nafea Bshara.

GateNews4giờ trước
Bình luận
0/400
Không có bình luận