Ant Group mở mã nguồn mô hình Ling-2.6-flash: 104B tham số với 7,4B tham số hoạt động, đạt nhiều mốc SOTA

Tin tức từ Gate, ngày 29 tháng 4 — Trọng số mô hình Ling-2.6-flash của Ant Group hiện đã được mở mã nguồn công khai, trước đây chỉ có sẵn thông qua API. Mô hình có tổng cộng 104 tỷ tham số với 7,4 tỷ tham số được kích hoạt cho mỗi lần suy luận, cửa sổ ngữ cảnh 256K và giấy phép MIT. Các phiên bản độ chính xác BF16, FP8 và INT4 có sẵn trên HuggingFace và ModelScope.

Ling-2.6-flash giới thiệu các cải tiến chú ý tuyến tính lai (hybrid linear attention) so với Ling 2.0, nâng cấp GQA gốc lên kiến trúc hybrid 1:7 MLA kết hợp Lightning Linear, cùng với MoE có độ thưa cực cao. Hiệu suất suy luận vượt đáng kể các mô hình tương đương: tốc độ tạo đỉnh đạt 340 token/giây trên 4 GPU H20, với thông lượng prefill và decode cao hơn khoảng 4 lần so với các mô hình mã nguồn mở tương đương. Các benchmark liên quan đến tác nhân cho thấy hiệu suất mạnh: BFCL-V4, TAU2-bench, SWE-bench Verified (61,2%), Claw-Eval và PinchBench đạt hoặc tiến gần mức SOTA. Trong toàn bộ bộ bài benchmark Artificial Analysis, tổng mức tiêu thụ token chỉ là 15 triệu. Trên AIME 2026, mô hình đạt 73,85%.

Trang web chính thức của Ant Group cũng liệt kê phiên bản flagship Ling-2.6-1T (phiên bản nghìn tỷ tham số) và phiên bản nhẹ (lightweight) Ling-2.6-mini (phiên bản nhẹ), tuy nhiên tính đến thời điểm xuất bản, trọng số của họ vẫn chưa được phát hành trên HuggingFace, chỉ có dòng flash hiện có thể tải xuống.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

Nhà phân tích ngành bán dẫn lạc quan về xu hướng AI “ít nhất còn đi thêm 3 năm”: đóng gói tiên tiến mới là nút thắt của ngành

Bubble Boi cho rằng chu kỳ đầu tư bằng AI vẫn ở giai đoạn sớm, dự kiến ít nhất còn thêm ba năm tăng giá, và không có ý định chốt lời. Anh ấy cho rằng đóng gói tiên tiến mới là nút thắt thực sự của ngành bán dẫn, cần tích hợp thêm nhiều HBM và các chip lớn hơn trong cùng một gói. Anh ấy lạc quan về NAND/Flash, giá có thể tiếp tục tăng, và trong tương lai có thể tham gia chuỗi cung ứng flash. Chiến lược cá nhân của anh ấy là vay vốn để gia tăng nắm giữ, đồng thời dùng nền tảng chuyên môn kỹ thuật để hiểu các chi tiết công nghệ, coi đây là một lợi thế.

ChainNewsAbmedia4phút trước

AWS Mở rộng Tích hợp OpenAI trong Amazon Bedrock

Amazon Web Services đã công bố vào ngày 29 tháng 4 một sự mở rộng đáng kể trong quan hệ hợp tác của mình với OpenAI, tích hợp các năng lực mới nhất của OpenAI vào cơ sở hạ tầng đám mây của họ. Sự mở rộng này mang đến ba dịch vụ mới cho Amazon Bedrock: các mô hình mới nhất của OpenAI (limited preview), bộ lập trình

CryptoFrontier16phút trước

Các nhà nghiên cứu của OpenAI: Hệ thống AI có thể xử lý phần lớn công việc nghiên cứu trong vòng hai năm

Tin tức Cổng, ngày 29 tháng 4 — Các nhà nghiên cứu của OpenAI, Sébastien Bubeck và Ernest Ryu, cho biết các hệ thống AI có thể thực hiện phần lớn công việc nghiên cứu của con người trong vòng hai năm, coi toán học là thước đo rõ ràng cho tiến bộ của AI. Khác với các bài kiểm tra hiệu suất mơ hồ, các bài toán mang lại khả năng xác minh chính xác: câu trả lời hoặc đúng hoặc sai, không để chỗ cho sự mơ hồ:

GateNews47phút trước

Quốc vương Charles III gặp sáu CEO công nghệ Mỹ, gồm Jensen Huang, Jeff Bezos và Tim Cook, để thảo luận quỹ khởi nghiệp của Vương quốc Anh

Tin tức Gate, ngày 29 tháng 4 — Trong chuyến thăm cấp nhà nước tới Hoa Kỳ, Quốc vương Charles III đã gặp sáu nhà lãnh đạo công nghệ Mỹ hàng đầu tại Blair House ở Washington: CEO NVIDIA Jensen Huang, người sáng lập Amazon Jeff Bezos, CEO Apple Tim Cook, CEO AMD Su Zifeng, CEO Salesforce Marc Benioff, và

GateNews55phút trước

Lượng giao hàng kính thông minh AR toàn cầu tăng 98% trong năm 2025, nhờ công nghệ màn hình Ray-Ban Display và waveguide của Meta

Tin tức từ Gate, ngày 29 tháng 4 — Lượng giao hàng kính thông minh thực tế tăng cường (AR) toàn cầu đã tăng 98% trong năm 2025, và lượng giao hàng nửa cuối năm tăng 148% so với cùng kỳ năm trước, theo Counterpoint Research. Mức tăng được thúc đẩy bởi việc mở rộng sản lượng

GateNews1giờ trước

Nhà giao dịch quỹ phòng hộ huyền thoại chia sẻ về P/E của cổ phiếu Mỹ: Trong vài năm tới, những người mua toàn bộ thị trường sẽ rất khó để thu được lợi nhuận

Quản lý quỹ phòng hộ Paul Tudor Jones (Jones) nhận phỏng vấn, cảnh báo rằng khoảng trống trong quản lý AI có thể mang lại hậu quả thảm khốc vì nó phá vỡ—rủi ro theo mô hình lặp lại-rút lui chưa từng thấy. Ông cũng chỉ ra rằng tỷ lệ vốn hóa thị trường của cổ phiếu Mỹ so với GDP đạt 252%, và hệ số P/E đang ở mức cao; đầu tư dài hạn vào toàn bộ thị trường khó có lợi nhuận. Ông dùng phép ẩn dụ quyền anh để nói rằng cơ hội giao dịch hiếm hoi, và kêu gọi sự hợp tác toàn cầu nhằm xây dựng khung quản lý AI.

ChainNewsAbmedia1giờ trước
Bình luận
0/400
Không có bình luận