Anthropic ra mắt $100M chiến dịch an ninh mạng với mô hình AI hạn chế Claude Mythos

2026-04-08 12:35:07

Anthropic đã công bố Project Glasswing vào thứ Ba, một sáng kiến an ninh mạng cam kết tối đa $100 triệu tín dụng sử dụng cho Claude Mythos Preview, một mô hình tiên phong chưa được phát hành mà công ty cho biết có thể tự động tìm và khai thác các lỗ hổng phần mềm ở mức vượt qua tất cả trừ những nhà nghiên cứu an ninh con người lành nghề nhất.

Thay vì phát hành công khai, Anthropic đã giới hạn Claude Mythos Preview cho 12 đối tác ra mắt — trong đó có Amazon $AMZN +0.46% Web Services, Apple $AAPL -2.07%, Broadcom $AVGO +6.21%, Cisco $CSCO +0.30%, CrowdStrike $CRWD +6.18%, Google $GOOGL +1.82%, JPMorganChase, the Linux Foundation, Microsoft $MSFT -0.16%, Nvidia $NVDA +0.26%, và Palo Alto Networks $PANW +4.89% — tất cả sẽ triển khai nó độc quyền cho mục đích an ninh phòng thủ. Hơn 100Mổ chức bổ sung khác xây dựng hoặc duy trì hạ tầng phần mềm quan trọng cũng sẽ nhận được quyền truy cập.

Nội dung liên quan

Alibaba ra mắt cụm AI 10.000 chip sử dụng chip của riêng mình

WomenofGenAI founder Aakriti Srikanth về việc nổi bật khi ngành công nghệ phát triển

Trong vài tuần qua, Anthropic đã dùng Mythos Preview để xác định hàng nghìn lỗ hổng zero-day trên mọi hệ điều hành và trình duyệt web lớn, công ty cho biết. Các phát hiện cụ thể bao gồm một lỗi có từ 27 năm trước trong OpenBSD và một lỗ hổng riêng biệt trong thư viện xử lý video FFmpeg – loại mà đã không bị phát hiện qua năm triệu lượt thử nghiệm của các công cụ kiểm thử tự động dù đã xấp xỉ 16 năm tuổi. Mô hình cũng xâu chuỗi nhiều lỗ hổng trong kernel Linux để đạt được toàn quyền điều khiển một máy tính từ một tài khoản người dùng thông thường.

Anthropic lưu ý rằng không có đào tạo chuyên sâu về an ninh mạng nào được đưa vào để xây dựng Mythos Preview — khả năng của mô hình trong việc thăm dò phần mềm để tìm điểm yếu là hệ quả phụ của chính những tiến bộ chung trong lập trình và suy luận đã định hình nó trên các lĩnh vực khác, nghĩa là các thuộc tính giúp nó sửa lỗi là không thể tách rời với những thuộc tính có thể được dùng để khai thác chúng.

Anthropic đang đóng góp $4 triệu tiền quyên góp trực tiếp cùng với các tín dụng sử dụng, bao gồm $2,5 triệu cho Alpha-Omega và Open Source Security Foundation thông qua Linux Foundation, và $1,5 triệu cho Apache Software Foundation. Các đối tác dùng cạn quỹ tín dụng sử dụng sẽ trả $25 cho mỗi triệu token đầu vào và $125 cho mỗi triệu token đầu ra. Mô hình có thể truy cập thông qua Claude API, Amazon Bedrock, Google Cloud Vertex AI và Microsoft Foundry.

“Những nguy cơ khi làm sai là hiển nhiên, nhưng nếu chúng ta làm đúng, sẽ có một cơ hội thực sự để tạo ra một internet và thế giới an toàn hơn một cách căn bản so với trước khi có các năng lực mạng dựa trên AI,” CEO Dario Amodei cho biết trong một bài đăng trên X $TWTR 0.00%, theo CNBC.

Trong các nhận xét bằng văn bản được công bố cùng với thông báo của Anthropic, CTO của CrowdStrike Elia Zaitsev đưa ra một cảnh báo thẳng thừng: mô hình “cho thấy điều hiện nay đã có thể thực hiện cho những người bảo vệ ở quy mô lớn, và các đối thủ sẽ không tránh khỏi việc tìm cách khai thác cùng những năng lực đó,” và những tác vụ từng đòi hỏi hàng tháng công việc “nay diễn ra trong vài phút với AI,” theo The New York Times.

Anthropic cho biết họ đã tham gia các cuộc thảo luận đang diễn ra với các quan chức chính phủ Mỹ, bao gồm Cơ quan An ninh mạng và An toàn hạ tầng (Cybersecurity and Infrastructure Security Agency), về năng lực của mô hình. Trong vòng 90 ngày, công ty cho biết họ dự định công bố một báo cáo công khai về các lỗ hổng được tìm thấy và đã được vá, cũng như các khuyến nghị về cách các thực hành an ninh nên thay đổi.

Sự tồn tại của mô hình đã được lộ ra công khai trước đó sau khi các tài liệu dự thảo nội bộ được tìm thấy ở một vị trí không được bảo mật trên máy chủ của Anthropic; công ty xác định nguyên nhân phơi lộ là do cấu hình sai trong một công cụ quản lý nội dung của bên thứ ba. Mô hình được nhắc đến trong các tài liệu đó bằng mã tên “Capybara.”

📬 Đăng ký Daily Brief

Bản tin miễn phí, nhanh và vui nhộn của chúng tôi về kinh tế toàn cầu, được gửi mỗi sáng vào các ngày trong tuần.

Đăng ký ngay

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.