Google lại phát hành "minh bạch kỹ thuật", gây tranh cãi về bài báo làm sụp đổ cổ phiếu lưu trữ toàn cầu

robot
Đang tạo bản tóm tắt

AI · TurboQuant kỹ thuật làm rõ có thể làm dịu tranh cãi học thuật không?

Ngày 1 tháng 4, sau gần một tuần im lặng, nhóm tác giả bài báo về thuật toán nén gây tranh cãi TurboQuant của Google cuối cùng đã phản hồi. Tuy nhiên, “làm rõ kỹ thuật” mới nhất này dường như vẫn chưa xoa dịu tranh cãi, khi cáo buộc “tương đồng về công nghệ cốt lõi”, Google biện hộ rằng xoay ngẫu nhiên là kỹ thuật tiêu chuẩn, và cho rằng lỗi trong tiêu chuẩn thử nghiệm “không quan trọng đối với thực tế”.

Trong tuần cuối cùng của tháng 3, bài báo này được blog chính thức của Google tuyên truyền rầm rộ, đã một mình gây ảnh hưởng lớn đến cổ phiếu chip lưu trữ toàn cầu, khiến giá trị của Micron, SK Hynix, Samsung Electronics giảm hơn 90 tỷ USD. Bài báo chỉ ra rằng, thuật toán nén TurboQuant có thể giảm ít nhất 6 lần bộ nhớ đệm KV của mô hình ngôn ngữ lớn, tăng tốc độ lên tới 8 lần, mà không mất độ chính xác.

Sự hoảng loạn của Phố Wall xuất phát từ việc: nếu phần mềm có thể nén yêu cầu bộ nhớ AI gấp 6 lần, thì logic tăng trưởng của phần cứng chip sẽ phải viết lại.

Tuy nhiên, sự đảo ngược diễn ra rất nhanh. Ngày 27 tháng 3, tác giả RaBitQ, nghiên cứu sinh tại ETH Zurich Gao Jianyang đăng bài dài hàng vạn chữ trên Zhihu, cáo buộc nhóm Google tồn tại vấn đề hệ thống trong nghiên cứu, lập tức dư luận chuyển sang chất vấn về đạo đức học thuật của Google.

Phần lớn ngành công nghiệp cho rằng, RaBitQ là người đề xuất phương pháp sáng tạo đầu tiên, TurboQuant dựa trên đó đã tối ưu hóa, nhưng không được trích dẫn hoặc tôn trọng đúng mức, thậm chí còn có hành vi hạ thấp không công bằng.

Ngày 1 tháng 4, trước các cáo buộc từ bên ngoài, tác giả thứ hai của bài báo Majid Daliri cuối cùng đã xuất hiện, đại diện nhóm đăng một bản “làm rõ kỹ thuật” gồm bốn điểm trên nền tảng OpenReview.

Về tính mới của công nghệ cốt lõi, Google biện hộ rằng, phương pháp chính của TurboQuant không bắt nguồn từ RaBitQ. Bởi “xoay ngẫu nhiên là kỹ thuật tiêu chuẩn, phổ biến trong tài liệu về lượng hóa”, đã được sử dụng rộng rãi trước khi RaBitQ xuất hiện. Thực sự đổi mới của TurboQuant nằm ở việc dẫn ra phân phối tọa độ sau khi xoay.

Tuy nhiên, quy tắc trong giới học thuật là: nếu ai đó là người đầu tiên dùng “bánh xe” cho “ô tô”, và tạo ra chiếc xe hoàn chỉnh, thì những người sau đó trích dẫn và cảm ơn là phép lịch sự học thuật cơ bản. Google xem nhẹ thành quả của người đi trước như kiến thức ngành, coi như đó là điều hiển nhiên, làm giảm giá trị đóng góp của người tiên phong.

Thứ hai, về cáo buộc hạ thấp lý thuyết RaBitQ thành “kém tối ưu”, tác giả bài báo thừa nhận, do họ không xem kỹ phần phụ lục của đối phương, bỏ sót một hệ số hằng số, dẫn đến kết luận vội vàng, “khiến chúng tôi ban đầu mô tả phương pháp này là kém tối ưu một cách trung thực”. Sau khi nghiên cứu kỹ hơn, phát hiện RaBitQ thực sự là tối ưu nhất, nhóm đang cập nhật bản thảo TurboQuant.

Tuy nhiên, một bài báo hội nghị hàng đầu dựa trên việc đánh giá tiêu cực về lý thuyết cốt lõi của đồng nghiệp dựa trên “không xem kỹ phần phụ lục” này, rõ ràng độ tin cậy của lời giải thích này còn nhiều tranh cãi.

Về điểm thứ ba, cáo buộc “dồn đối thủ vào chân tường để chạy đua”, Majid Daliri trực tiếp chỉ ra rằng, ngay cả khi bỏ qua so sánh thời gian chạy với RaBitQ, ảnh hưởng khoa học và hiệu quả của bài báo vẫn cơ bản giữ nguyên. Bởi vì đóng góp chính của TurboQuant là sự cân bằng giữa chất lượng nén và tốc độ, chứ không phải là tăng tốc cụ thể.

Trước đó, Gao Jianyang trong thư công khai tiết lộ, nhóm Google khi thử nghiệm RaBitQ đã dùng CPU đơn nhân và tắt đa luồng, còn khi thử TurboQuant thì dùng GPU Nvidia A100. Dù nhóm khẳng định tốc độ không phải là điểm chính, nhưng trong bài báo vẫn lấy tốc độ làm một trong những điểm bán hàng chính.

Cuối cùng, Google trong phản hồi ám chỉ đối phương “có ý đồ khác”, cho biết bài báo đã được đăng trên arXiv từ tháng 4 năm 2025, đối phương có gần một năm để đưa vấn đề qua các kênh học thuật, nhưng chỉ khi bài báo thu hút sự chú ý rộng rãi mới bắt đầu gây chuyện.

Theo phản hồi của Gao Jianyang trước đó, từ tháng 5 năm 2025, hai bên đã trao đổi qua email riêng, tháng 11 năm 2025 còn liên hệ với ban tổ chức ICLR, nhưng đều không nhận được phản hồi hiệu quả. Đến khi Google chính thức đưa bài báo lên sân khấu truyền thông với lượng tiếp cận hàng chục triệu, việc chỉnh sửa học thuật mới trở nên cấp bách.

Trên OpenReview, có nhà nghiên cứu bình luận rằng, đây là vấn đề nghiêm trọng đáng cần nhiều sự chú ý hơn. “Thấy người làm công việc nền tảng thực sự bị bỏ qua, còn các tổ chức lớn có ảnh hưởng lại quảng bá rầm rộ thành quả của mình, thật đáng thất vọng.” Trong điểm này, cảm giác không phải là khoa học, mà giống như một cuộc chiến truyền thông với các tập đoàn lớn.

Cùng lúc, các bình luận của reviewer về bài báo TurboQuant cũng thể hiện thái độ, cho biết do phân tích lý thuyết và kết quả thực nghiệm, họ đã đánh giá cao bài báo này.

“Tuy nhiên tôi cũng rõ ràng chỉ ra, RaBitQ và TurboQuant đều dùng xoay ngẫu nhiên, yêu cầu tác giả TurboQuant so sánh ảnh hưởng của sự khác biệt thiết kế giữa TurboQuant và RaBitQ.” Reviewer này nói, thực hành đúng đắn trong học thuật là thảo luận sâu về sự khác biệt giữa RaBitQ và TurboQuant trong bài báo, nhưng khi xem xét, “thật ngạc nhiên khi phát hiện RaBitQ chỉ đề cập một lần trong phần thử nghiệm của bài chính”.

Không thể phủ nhận, TurboQuant có tiềm năng thương mại về mặt kỹ thuật. Một thạc sĩ AI phân tích trên Zhihu rằng, trong các kịch bản suy luận mô hình lớn, bộ nhớ đệm KV chiếm dụng trực tiếp quyết định số yêu cầu xử lý đồng thời của mỗi card đơn, là chỉ số kinh tế cốt lõi của nhà cung cấp dịch vụ suy luận. Cùng một card, nếu khả năng xử lý đồng thời tăng gấp 6 lần, chi phí suy luận cho mỗi yêu cầu về lý thuyết có thể giảm xuống còn một phần sáu. Đối với các nhà cung cấp AI xử lý hàng tỷ API mỗi ngày, đây sẽ là một công cụ giảm chi phí cực lớn, cũng là nguyên nhân gây chấn động thị trường chứng khoán lần này.

Bài báo của Google dự kiến sẽ được trình bày tại hội nghị hàng đầu về học máy ICLR 2026 vào cuối tháng 4, nhưng rõ ràng nhóm cần vượt qua rào cản tranh cãi học thuật này trước. Kết cục của vụ việc này vẫn còn để xem.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim