Tin cổng, ngày 24 tháng 4 — DeepSeek đã phát hành loạt mô hình mã nguồn mở V4 theo Giấy phép MIT, với trọng số hiện đã có trên Hugging Face và ModelScope. Loạt này bao gồm hai mô hình (MoE) dạng mixture-of-experts: V4-Pro với 1,6 nghìn tỷ tham số tổng và 49 tỷ tham số được kích hoạt mỗi token, và V4-Flash với 284 tỷ tham số tổng và 13 tỷ tham số được kích hoạt mỗi token. Cả hai đều hỗ trợ cửa sổ ngữ cảnh 1 triệu token.
Kiến trúc có ba nâng cấp chính: một cơ chế attention lai kết hợp attention thưa nén (CSA) và attention nén mạnh (HCA), giúp giảm đáng kể chi phí phát sinh cho ngữ cảnh dài—FLOPs suy luận của V4-Pro cho ngữ cảnh 1M chỉ bằng 27% của V3.2, và bộ nhớ đệm KV (VRAM) để lưu thông tin lịch sử trong quá trình suy luận( chỉ bằng 10% của V3.2; các siêu liên kết ràng buộc đa tạp )mHC( thay thế các kết nối residual truyền thống để tăng cường độ ổn định lan truyền tín hiệu giữa các lớp; và bộ tối ưu hóa Muon để hội tụ huấn luyện nhanh hơn. Tiền huấn luyện sử dụng hơn 32 nghìn tỷ token dữ liệu.
Hậu huấn luyện áp dụng phương pháp hai giai đoạn: đầu tiên huấn luyện các chuyên gia theo miền thông qua supervised fine-tuning )SFT( và học tăng cường GRPO, sau đó hợp nhất chúng thành một mô hình thông qua chưng cất trực tuyến. V4-Pro-Max )highest inference mode tuyên bố là mô hình mã nguồn mở mạnh nhất với các bộ đánh giá mã hóa hàng đầu và khoảng cách thu hẹp đáng kể so với các mô hình “biên” mã nguồn đóng về các tác vụ suy luận và tác nhân. V4-Flash-Max đạt hiệu năng suy luận tầm Pro với đủ ngân sách tính toán nhưng bị giới hạn bởi quy mô tham số đối với kiến thức thuần túy và các tác vụ tác nhân phức tạp. Trọng số được lưu ở độ chính xác kết hợp FP4+FP8.
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo
Tuyên bố miễn trừ trách nhiệm.
Bài viết liên quan
DeepSeek V4 Đạt Điểm Hoàn Hảo Trên Putnam-2025, Hòa Với Axiom Trong Suy Luận Toán Học Chính Thức
Tin tức từ Gate, ngày 24 tháng 4 — DeepSeek V4 đã công bố kết quả từ các bài đánh giá suy luận toán học chính thức, đạt điểm tuyệt đối 120/120 trên Putnam-2025, hòa với Axiom ở vị trí số 1.
Trong chế độ thực dụng sử dụng LeanExplore và lấy mẫu bị ràng buộc, V4-Flash-Max đạt 81.00 trên
GateNews8phút trước
Dùng AI nào khiến thể hiện thân phận và địa vị đáng ngưỡng mộ nhất? Nghiên cứu tiết lộ thu nhập người dùng của Claude cao hơn hẳn so với các đối thủ, Meta AI xếp cuối
Cuộc khảo sát của Epoch AI cho thấy người dùng Claude chủ yếu thuộc nhóm có thu nhập cao, 80% có thu nhập hằng năm trên 100.000 USD; Meta AI có phân phối thu nhập rộng nhất, 36,5% ở mức trên 100.000, tỷ lệ người thu nhập thấp chiếm cao nhất; giá của Claude tăng và áp dụng tính phí theo từng gói, chi phí có thể tăng lên, trong khi Meta có mức vào dễ hơn. Trong tương lai, dùng AI nào có thể trở thành nhãn nhận diện danh tính ngầm.
ChainNewsAbmedia13phút trước
V4-Pro Đạt Tỷ Lệ Vượt Kiểm Tra Viết Mã 67% Trong Bài Test Tự Dùng Nội Bộ, Tiệm Cận Hiệu Năng của Opus 4.5
Tin tức cổng, ngày 24 tháng 4 — V4 đã công bố công khai dữ liệu tự dùng nội bộ (dogfooding) cho mô hình V4-Pro của mình. Công ty đã thu thập khoảng 200 tác vụ kỹ thuật thực tế từ hơn 50 kỹ sư, bao gồm phát triển tính năng, sửa lỗi, tái cấu trúc (refactoring) và chẩn đoán trên nhiều ngăn xếp công nghệ, bao gồm
GateNews27phút trước
Vương quốc Anh xem xét AI của Anthropic để củng cố an ninh mạng ngân hàng
Vương quốc Anh đang khám phá một bước đi lớn trong an ninh mạng tài chính bằng cách hợp tác với công ty AI Anthropic. Các cuộc thảo luận ban đầu cho thấy chính phủ có thể triển khai mô hình Claude Mythos tiên tiến của Anthropic trên các ngân hàng và tổ chức tài chính. Động thái này nhằm cải thiện khả năng phòng thủ trước các mối đe dọa mạng lưới tấn công
CryptometerIo32phút trước
Văn phòng Sở hữu trí tuệ của Trung Quốc bổ sung AI, chất bán dẫn và giao diện não–máy tính vào chương trình bảo hộ nhanh
Tin cổng, ngày 24 tháng 4 — Cục Sở hữu Trí tuệ Quốc gia Trung Quốc đã công bố vào ngày 24 tháng 4 rằng họ sẽ thiết lập cơ chế bảo hộ toàn diện quyền sở hữu trí tuệ cho các công nghệ mới nổi thông qua cải cách thể chế, dịch vụ được nâng cao và mở rộng ứng dụng. Cơ quan này sẽ
GateNews39phút trước