Anthropic đã phát hành một phiên bản nâng cấp của mô hình chủ lực của họ, Claude Opus 4.7, vào ngày 16 tháng 4 (theo giờ địa phương). So với mô hình Opus 4.6 trước đó, Opus 4.7 thể hiện “những cải thiện đáng kể” về năng lực kỹ thuật phần mềm nâng cao, đặc biệt trong các tác vụ khó, với độ chặt chẽ và tính nhất quán được nâng cao trong các tác vụ phức tạp chạy lâu và khả năng nhìn được cải thiện. Tuy nhiên, Anthropic đã cố ý làm suy yếu khả năng tấn công-phòng thủ an ninh mạng của mô hình trong quá trình huấn luyện và đưa vào các cơ chế an toàn để tự động phát hiện và chặn các yêu cầu bị cấm hoặc có rủi ro cao.

Hiệu suất và điểm chuẩn

Trong thử nghiệm điểm chuẩn, Opus 4.7 đạt các mức điểm nhìn chung cao hơn so với Opus 4.6 trước đó và mô hình cạnh tranh GPT-5.4. Tuy nhiên, Anthropic nhấn mạnh rằng năng lực tổng thể của Opus 4.7 không tương xứng với mô hình mạnh nhất của công ty, Claude Mythos Preview. Theo Anthropic: “Bằng cách triển khai và vận hành các cơ chế bảo vệ này trong thế giới thực, chúng tôi sẽ tích lũy kinh nghiệm để cuối cùng cho phép phát hành rộng rãi các mô hình cấp Mythos.”

Triển khai và giá cả

Opus 4.7 hiện đã hoạt động trên tất cả các sản phẩm Claude và các giao diện API, được tích hợp với các dịch vụ Amazon Bedrock, Google Cloud Vertex AI và Microsoft Foundry. Giá vẫn giữ nguyên so với Opus 4.6: $5 cho mỗi một triệu token đầu vào và $25 cho mỗi một triệu token đầu ra.

Thay đổi tiêu thụ token

Hai thay đổi trong Opus 4.7 so với Opus 4.6 sẽ ảnh hưởng đến việc sử dụng token. Thứ nhất, Opus 4.7 sử dụng bộ mã hóa (tokenizer) được cập nhật, cải thiện cách mô hình xử lý văn bản. Tuy nhiên, điều này có nghĩa là các đầu vào giống hệt nhau có thể tiêu thụ nhiều token hơn—khoảng 1 đến 1,35 lần mức tiêu thụ của thế hệ trước.

Thứ hai, Opus 4.7 thực hiện nhiều suy luận hơn ở mức “mức độ suy nghĩ” cao hơn, đặc biệt trong các vòng tiếp theo của các kịch bản dạng tác nhân. Điều này giúp tăng độ tin cậy cho các bài toán phức tạp nhưng tạo ra thêm các token đầu ra.

Gia tăng tiêu thụ token của Opus 4.7. Nguồn: Anthropic

Phân tích thị trường và bối cảnh

Các nhà phân tích mô tả Opus 4.7 là một mô hình “mang tính chuyển tiếp”. Nhà phân tích đầu tư Adam Button cho biết việc phát hành Opus 4.7 củng cố câu chuyện của Anthropic xung quanh các mô hình “siêu phàm” như Mythos và xác nhận sự hoài nghi của thị trường: các mô hình trả phí hiện có công khai về cơ bản là các phiên bản “lite” bị ràng buộc bởi các cơ chế an toàn.

Nền tảng công ty và mốc tài chính

Anthropic, được thành lập năm 2021 bởi các cựu nhân viên OpenAI, phát triển dòng mô hình ngôn ngữ lớn Claude. Vào ngày 6 tháng 4, Anthropic công bố doanh thu hàng năm hóa của họ (ARR) vượt $300 billion, mức tăng đáng kể so với $9 billion vào cuối năm 2025. Công ty đang tích cực theo đuổi một đợt phát hành cổ phiếu lần đầu ra công chúng.

Lo ngại rủi ro an ninh mạng

Các lãnh đạo của Anthropic đã nhiều lần cảnh báo về tác động của AI đối với an ninh mạng. Theo các báo cáo đề ngày 10 tháng 4 (theo giờ địa phương), Bộ trưởng Tài chính Mỹ Yellen và Chủ tịch Cục Dự trữ Liên bang Powell đã tổ chức một cuộc họp khẩn với các lãnh đạo Phố Wall vào ngày 7 tháng 4 để thảo luận về việc mô hình AI Mythos mới nhất của Anthropic có thể làm gia tăng rủi ro an ninh mạng như thế nào. Anthropic đã tuyên bố Mythos không phù hợp để phát hành công khai vì mô hình có thể bị lạm dụng bởi tội phạm mạng và gián điệp. Công ty đang cung cấp quyền truy cập có chọn lọc vào Mythos cho các doanh nghiệp hàng đầu toàn cầu về an ninh mạng và phần mềm.

Xem nguồn

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

NEA nghiên cứu việc ứng dụng trí tuệ nhân tạo trong quản lý quy định hạt nhân

Tin tức ngành AI

Nhóm công tác NEA về Công nghệ mới đã triệu tập một hội thảo vào ngày 25--26 tháng 3, tập trung vào cách trí tuệ nhân tạo có thể được áp dụng cho hoạt động giám sát tuân thủ và hoạt động nội bộ trong các cơ quan hạt nhân. Tóm tắt Hội thảo NEA đã khám phá các ứng dụng AI trong thế giới thực đối với quản lý hạt nhân, với

Cryptonews1giờ trước

Trung Quốc sẽ thử nghiệm hơn 300 robot hình người tại giải bán marathon ở Bắc Kinh vào ngày 19 tháng 4

Tin tức ngành AI

Giải bán marathon robot nửa chặng thứ hai của Bắc Kinh có hơn 300 robot hình người đến từ 70 đội, tranh tài trên đường chạy 21 km. Những tiến bộ trong di chuyển tự chủ được nhấn mạnh, với 40% hoạt động mà không cần điều khiển. Trung Quốc thống lĩnh thị trường robot hình người, dù vẫn gặp thách thức trong sản xuất.

GateNews4giờ trước

Mỹ tìm cách tăng nhập khẩu uranium từ Namibia để cung cấp năng lượng cho các nhà máy hạt nhân do AI dẫn dắt

Hàng hóa Tin tức ngành AI

Hoa Kỳ đang cân nhắc tăng nhập khẩu uranium từ Namibia để hỗ trợ năng lượng hạt nhân cho các trung tâm dữ liệu AI, trong bối cảnh Trung Quốc đang chi phối lĩnh vực uranium của Namibia. Giá uranium tăng trở lại đang khơi dậy mối quan tâm khai thác mỏ, dù khu vực khô hạn này đang gặp thách thức về nguồn cung nước.

GateNews4giờ trước

Các giám đốc điều hành OpenAI Bill Peebles và Kevin Weil rời nhiệm vụ trong đợt tái cơ cấu lãnh đạo

Tin tức ngành AI

Các giám đốc điều hành của OpenAI là Bill Peebles và Kevin Weil đã công bố việc rời đi của họ, là một phần trong chuỗi thay đổi về lãnh đạo khi công ty phi tập trung hóa hoạt động. Việc họ rời đi diễn ra sau một số lần rời đi đáng chú ý khác và sự thay đổi về cơ cấu của công ty.

GateNews5giờ trước

Zoom hợp tác với World để bổ sung phát hiện deepfake bằng nhận diện khuôn mặt

Tin tức ngành AI

Zoom đã hợp tác với World của Sam Altman để ra mắt một tính năng phát hiện người tham gia thực sự thay vì deepfake AI trong các cuộc gọi video. Mục tiêu là chống lại tình trạng lừa đảo deepfake đang gia tăng, với các tùy chọn xác minh cho người tổ chức và người tham gia.

GateNews5giờ trước

Báo cáo lỗi do AI tạo ra làm cho đội ngũ bảo trì cURL bị quá tải

Tin tức ngành AI

Báo cáo lỗi do AI tạo ra đang làm quá tải dự án cURL, với sự gia tăng đáng kể về số lượng báo cáo khiến nguồn lực bị căng thẳng. Các nhà bảo trì đang phản hồi bằng cách giới hạn quyền truy cập vào các mô hình AI và tạm dừng các chương trình thưởng lỗ hổng để quản lý làn sóng hồ sơ mới.

GateNews6giờ trước

Bình luận

0/400

StargazingWithAMirroredSphere

· 22giờ trước

Từ 4.6 đến 4.7 được gọi là "đáng kể", không rõ mức độ cải thiện lớn như thế nào trong việc gỡ lỗi chuỗi dài, tái cấu trúc và phạm vi kiểm thử?

Xem bản gốcTrả lời0

OrangePeelRadio

· 23giờ trước

Xin một tiêu chuẩn: Liệu có thể tìm hết tất cả các lỗi ẩn trong PR phức tạp một lần không? Đừng chỉ viết các đoạn demo nhỏ.

Xem bản gốcTrả lời0

BlackVelvetBluePeony

· 23giờ trước

Anthropic này có vẻ đang tiến nhanh, Claude bây giờ ngày càng giống như một "kỹ sư cao cấp" chứ không chỉ là một chatbot.

Xem bản gốcTrả lời0

ReminderOfWavesCrashingAgainst

· 23giờ trước

Nâng cao năng lực kỹ thuật phần mềm rất quan trọng, nhiệm vụ cấp độ kho mã nguồn mới là chiến trường thực sự.

Xem bản gốcTrả lời0

StargazingUnderTheGlassDome

· 04-17 07:32

4.7 Cuối cùng đã đến, mong đợi thử nghiệm thực tế.

Xem bản gốcTrả lời0

GateUser-5d719aba

· 04-17 07:26

Hy vọng không lại là việc tăng điểm dựa trên bảng xếp hạng, trong các dự án thực tế, khi gặp xung đột phụ thuộc hoặc vấn đề môi trường thì sẽ gặp sự cố.

Xem bản gốcTrả lời0

TheWaveOfRasterization

· 04-17 07:20

Tôi quan tâm hơn đến độ tin cậy của việc gọi công cụ và thay đổi nhiều tệp: liệu có thể duy trì tính nhất quán, không gây ra lỗi ở chỗ này rồi gây lỗi ở chỗ khác.

Xem bản gốcTrả lời0

StrollingOnTheEdgeOfTheDao

· 04-17 07:19

Chờ cộng đồng so sánh hiệu suất SWE của GPT/DeepSeek, đặc biệt là điều hướng kho lớn, định vị vấn đề, tốc độ giao hàng từ đầu đến cuối.

Xem bản gốcTrả lời0

BluePeonyObserver

· 04-17 07:19

4.7 của “tăng cường tính nghiêm ngặt” nghe có vẻ cẩn trọng hơn, có thể sẽ ít bịa đặt API hơn? Điều này quá quan trọng.

Xem bản gốcTrả lời0

Xem thêm