Cambricon Hoàn Tất Thích Ứng Day 0 của DeepSeek-V4, Đánh Dấu Mốc Cho Hệ Sinh Thái Chip AI của Trung Quốc

Thông điệp Tin Cổng, ngày 24 tháng 4 — Cambricon hôm nay đã công bố rằng hãng đã hoàn tất việc thích ứng Day 0 của DeepSeek-V4, mô hình ngôn ngữ lớn mới nhất từ DeepSeek, bằng hệ sinh thái phần mềm NeuWare độc quyền của hãng và framework vLLM. Đồng thời, mã nguồn thích ứng cũng đã được công khai, đánh dấu lần thứ hai liên tiếp Cambricon cung cấp hỗ trợ chip gốc vào đúng ngày ra mắt mô hình mới của DeepSeek.

Để tối ưu kiến trúc mới mẻ của DeepSeek-V4, Cambricon đã tận dụng thư viện toán tử Torch-MLU-Ops hiệu năng cao của mình cho việc tăng tốc chuyên biệt các mô-đun như Compressor và mHC. Công ty cũng sử dụng ngôn ngữ lập trình BangC để phát triển các kernel được tối ưu hóa cao cho các toán tử quan trọng như sparse/compressed Attention và GroupGemm, khai thác đầy đủ khả năng nền tảng của phần cứng. Các nỗ lực đồng tối ưu hóa phần mềm–phần cứng trước đây giữa hai công ty đã đạt được các mức độ tận dụng tính toán hàng đầu trong ngành.

DeepSeek-V4, được ra mắt hôm nay và là mã nguồn mở, có cửa sổ ngữ cảnh mở rộng lên đến một triệu token, khả năng Agent mạnh mẽ và hiệu năng suy luận vượt trội. Cambricon cho biết việc DeepSeek-V4 chạy gốc trên chip Cambricon là một cột mốc quan trọng đối với ngành công nghiệp AI của Trung Quốc.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

Cursor vạch ra lý do huấn luyện XAI: năng lực tính toán bị kẹt, SpaceX nắm riêng quyền chọn mua trị giá 60 tỷ USD

Anysphere thông báo rằng Cursor sẽ cùng xAI sử dụng hạ tầng Colossus để huấn luyện mô hình mới nhằm vượt qua nút thắt về năng lực tính toán; SpaceX đưa ra quyền chọn mua lại trị giá 60 tỷ USD (trong vòng 2026 có thể mua lại toàn bộ), nếu không thì sẽ thanh toán khoảng 10 tỷ USD như khoản bồi thường hợp tác. Hai giao dịch được tiến hành đồng thời, định hình ai có thể huấn luyện Cursor và ai có thể mua lại Cursor; Cursor vẫn cho phép nhiều backend mô hình, nhưng về dài hạn sẽ phụ thuộc vào việc SpaceX có thực hiện quyền mua lại hay không.

ChainNewsAbmedia9phút trước

Định giá thị trường thứ cấp của Anthropic vượt 1 nghìn tỷ USD: Forge Global vượt OpenAI 8.800 tỷ

Theo báo cáo của Decrypt, định giá cấp hai của Anthropic của Forge Global khoảng 1 nghìn tỷ USD, của OpenAI khoảng 880 tỷ USD, và lần đầu tiên trên thị trường cấp hai xảy ra sự đảo chiều dẫn đầu. ARR của Anthropic tăng từ khoảng 9 tỷ vào cuối năm 2025 lên khoảng 30 tỷ vào tháng 3 năm 2026, tăng trưởng trong ba tháng là 233%, qua đó thúc đẩy định giá tư nhân. Định giá cấp hai khác với vòng gọi vốn cấp một, phản ánh niềm tin vào việc thoái vốn; trong tương lai vẫn cần nhìn bốn kênh là công nghệ, chính sách, kinh doanh và câu chuyện.

ChainNewsAbmedia10phút trước

Meta Platforms Dự Kiến Cắt Giảm 10% Nhân Sự Vào Ngày 20 Tháng 5, Ảnh Hưởng Khoảng 8.000 Vị Trí

Tin tức từ Gate, ngày 24 tháng 4 — Meta Platforms dự kiến cắt giảm nhân sự của mình khoảng 10%, ảnh hưởng đến khoảng 8.000 vị trí, vào ngày 20 tháng 5. Các đợt sa thải được dự định nhằm nâng cao hiệu quả hoạt động đồng thời tăng đầu tư vào trí tuệ nhân tạo. Việc tái cơ cấu theo kế hoạch phản ánh

GateNews1giờ trước

Chính phủ Trump công bố kế hoạch trấn áp AI dùng để tinh luyện, cáo buộc các doanh nghiệp Trung Quốc có hệ thống trộm năng lực mô hình

Văn phòng Chính sách Công nghệ của Nhà Trắng (OSTP) Trợ lý Tổng thống Michael J. Kratsios (Michael J. Kratsios) vào ngày 23 tháng 4 đã đưa ra tuyên bố chính thức, cho biết chính quyền Trump nắm giữ thông tin, cho thấy các thực thể nước ngoài (chủ yếu đặt tại Trung Quốc) đang cố ý nhắm mục tiêu vào các công ty trí tuệ nhân tạo lớn của Mỹ, thông qua việc “hàng chục nghìn tài khoản đại lý” và các hệ thống kỹ thuật jailbreak để có được một cách có hệ thống năng lực của các mô hình AI của Mỹ, đồng thời công bố bốn biện pháp ứng phó.

MarketWhisper1giờ trước

DeepSeek ra mắt phiên bản xem trước mã nguồn mở V4, điểm kỹ thuật 3206 vượt qua GPT-5.4

DeepSeek vào ngày 24 tháng 4 đã chính thức phát hành bộ phiên bản xem trước V4, được cấp phép mở nguồn theo giấy phép MIT; trọng số mô hình đã được đồng bộ đưa lên Hugging Face và ModelScope. Theo báo cáo kỹ thuật DeepSeek V4, V4-Pro-Max (chế độ sức mạnh suy luận cao nhất) đạt 3206 điểm trên bộ chuẩn Codeforces, vượt qua GPT-5.4.

MarketWhisper1giờ trước

Tencent phát hành mã nguồn mở Hy3 phiên bản xem trước, bộ chuẩn kiểm thử hiệu năng mã nguồn tăng 40% so với phiên bản trước

Tencent vào ngày 23 tháng 4 đã chính thức mã nguồn mở mô hình ngôn ngữ lớn Hy3 phiên bản xem trước trên các nền tảng GitHub, Hugging Face và ModelScope, đồng thời cũng cung cấp dịch vụ API trả phí trên đám mây Tencent (Tencent Cloud). Theo Decrypt đưa tin vào ngày 24 tháng 4, Hy3 phiên bản xem trước đã bắt đầu huấn luyện từ cuối tháng 1 và, tính đến thời điểm phát hành, thời gian chưa đầy ba tháng.

MarketWhisper2giờ trước
Bình luận
0/400
Không có bình luận