Anthropic cảnh báo Claude Mythos Preview phát hiện lỗi nhanh…

Mô hình AI Claude Mythos Preview của Anthropic, hợp tác với khoảng 50 đối tác trong khuôn khổ Dự án Glasswing, đã phát hiện hơn 10.000 lỗ hổng nghiêm trọng trong các phần mềm hệ thống quan trọng. Số lượng lỗi đang gia tăng nhanh hơn khả năng vá lỗi của bất kỳ ai. Anthropic cảnh báo điều này tạo ra một giai đoạn chuyển đổi rủi ro cao và cho biết không có công ty nào, kể cả chính họ, đã xây dựng các biện pháp bảo vệ đủ mạnh để ngăn chặn việc lạm dụng các mô hình này. Bài viết Anthropic cảnh báo Claude Mythos Preview phát hiện lỗi nhanh hơn khả năng vá lỗi của nhà phát triển xuất hiện lần đầu trên The Decoder.

AI trong thực tiễn Anthropic cảnh báo Claude Mythos Preview phát hiện lỗi nhanh hơn khả năng vá lỗi của nhà phát triển. Matthias Bastian Ngày 23/5/2026 Các điểm chính Anthropic và khoảng 50 đối tác đã sử dụng mô hình AI Claude Mythos Preview để xác định hơn 10.000 lỗ hổng bảo mật nghiêm trọng trong phần mềm hệ thống quan trọng chỉ trong một tháng. Tốc độ phát hiện đã vượt quá khả năng xác minh và khắc phục các lỗi được xác định, theo công ty. Anthropic cảnh báo về một giai đoạn chuyển tiếp nguy hiểm, vì các mô hình AI như Claude Mythos có thể phát hiện lỗ hổng nhanh hơn nhiều so với khả năng vá lỗi của các tổ chức, tạo ra một khoảng cách bảo mật ngày càng lớn. Một tháng sau khi ra mắt Project Glasswing, Anthropic đang chia sẻ những kết quả đầu tiên. Công ty cho biết mô hình AI Claude Mythos Preview của họ, hợp tác với khoảng 50 đối tác, đã tìm thấy hơn 10.000 lỗ hổng bảo mật mức độ cao hoặc nghiêm trọng trong phần mềm hệ thống quan trọng. Mô hình hiện phát hiện các lỗ hổng bảo mật nhanh hơn khả năng xác minh, công bố và vá lỗi của các nhóm, Anthropic viết trong một bài đăng trên blog. Công ty đang giữ lại các chi tiết kỹ thuật cụ thể, vì thời hạn tiêu chuẩn của ngành để công bố các lỗ hổng mới là 90 ngày và hầu hết các phát hiện chưa thể được mô tả mà không gây rủi ro cho người dùng cuối. Các đối tác báo cáo mức tăng gấp mười lần trong việc phát hiện lỗi Anthropic cho biết các đối tác của Glasswing vận hành và xây dựng phần mềm cốt lõi cho internet và các cơ sở hạ tầng quan trọng khác. Mỗi đối tác đã tìm thấy hàng trăm lỗ hổng nghiêm trọng. Một số cũng cho biết tỷ lệ phát hiện lỗi của họ đã tăng hơn mười lần. Cloudflare cho biết họ đã gắn cờ 2.000 lỗi, trong đó có 400 lỗi mức độ cao hoặc nghiêm trọng. Tỷ lệ dương tính giả của họ tốt hơn so với người kiểm thử. Mozilla đã tìm và khắc phục 271 lỗ hổng trong Firefox 150, nhiều hơn gấp mười lần so với phiên bản tiền nhiệm, Claude Opus 4.6, đã phát hiện trong Firefox 148. Các đánh giá bên ngoài cũng xác nhận những con số này. Viện An ninh AI của Vương quốc Anh cho biết điểm kiểm tra Mythos Preview mới nhất là mô hình đầu tiên giải quyết hoàn toàn cả hai phạm vi mạng nội bộ của họ—các cuộc tấn công mạng đa giai đoạn mô phỏng. Nền tảng bảo mật độc lập XBOW gọi mô hình này là một bước tiến lớn so với tất cả các mô hình trước đó, với lý do "độ chính xác chưa từng có". Anthropic cho biết Mythos Preview cũng đứng đầu các điểm chuẩn học thuật ExploitBench và ExploitGym, với GPT-5.5 gần đạt được trong hầu hết các điểm chuẩn này và đã có sẵn công khai. Tác động cũng thể hiện ở số lượng bản vá, theo Anthropic: Palo Alto Networks đã phát hành số lượng bản vá gấp năm lần so với bình thường trong bản phát hành mới nhất của họ. Microsoft cho biết số lượng bản vá mới sẽ "tiếp tục tăng trong một thời gian". Oracle tuyên bố họ đang tìm và khắc phục lỗi nhanh hơn nhiều lần so với trước đây. Mythos Preview cũng đã chứng minh được sự hữu ích ngoài việc chỉ săn lỗi. Tại một ngân hàng đối tác, mô hình đã giúp phát hiện và chặn một giao dịch chuyển khoản gian lận trị giá hơn 1,5 triệu USD, Anthropic cho biết. Hơn 6.000 lỗ hổng tiềm ẩn trong các dự án mã nguồn mở Bên cạnh công việc với đối tác, Anthropic cho biết họ đã quét hơn 1.000 dự án mã nguồn mở bằng Mythos Preview. Mô hình ước tính đã tìm thấy 6.202 lỗ hổng mức độ cao hoặc nghiêm trọng, với tổng số 23.019 phát hiện trên tất cả các mức độ nghiêm trọng. Các công ty bảo mật độc lập và một phần Anthropic đã xem xét 1.752 phát hiện có mức độ nghiêm trọng cao hoặc nghiêm trọng cho đến nay. 90,6% trong số đó được xác định là đúng. 62,4% được xác nhận là thực sự nghiêm trọng hoặc có mức độ nghiêm trọng cao. Dựa trên tỷ lệ phân loại này, Anthropic ước tính Mythos Preview đã phát hiện gần 3.900 lỗ hổng đã được xác nhận có mức độ nghiêm trọng cao hoặc nghiêm trọng trong mã nguồn mở. Công ty có kế hoạch tiếp tục quét. Trong số 23.019 lỗ hổng được tìm thấy trong các dự án mã nguồn mở, chỉ có 97 lỗ hổng thực sự được vá. Biểu đồ cho thấy sự sụt giảm đáng kể từ giai đoạn phát hiện đến phân loại, công bố và vá lỗi. | Hình ảnh: Anthropic Một số nhà bảo trì mã nguồn mở đã yêu cầu Anthropic chậm lại việc công bố vì "họ cần thêm thời gian để thiết kế các bản vá", bài đăng trên blog cho biết. Trung bình, việc sửa một lỗi có mức độ nghiêm trọng cao hoặc nghiêm trọng mất hai tuần. Cho đến nay, 530 lỗi như vậy đã được báo cáo cho các nhà bảo trì. Trong số đó, 75 lỗi đã được vá và 65 lỗi đã có thông báo công khai. 827 lỗ hổng đã được xác nhận khác vẫn đang chờ được công bố. Tệ hơn nữa, các nhà bảo trì đã phải đối mặt với vô số báo cáo lỗi chất lượng thấp, do AI tạo ra. Anthropic cảnh báo về một giai đoạn chuyển tiếp rủi ro cao Anthropic cho biết các mô hình có khả năng an ninh mạng tương tự sẽ sớm được phổ biến rộng rãi. Một số có thể đã có sẵn. GPT-5.5 của OpenAI phù hợp với hồ sơ này, và cũng có một biến thể chuyên biệt hơn gọi là GPT-5.5 Cyber, mặc dù không rõ chính xác điều gì tạo nên sự khác biệt giữa hai loại này. Dù bằng cách nào, những khả năng mới này tạo ra một giai đoạn chuyển tiếp trong đó các lỗ hổng được tìm thấy nhanh chóng nhưng được vá chậm. Khoảng cách đó mang lại những rủi ro mới, Anthropic cho biết. Các mô hình Mythos-class cắt giảm thời gian và chi phí tìm kiếm và khai thác các lỗ hổng. Không có công ty nào, kể cả Anthropic, đã xây dựng các biện pháp bảo vệ đủ mạnh để ngăn chặn việc lạm dụng các mô hình này và ngăn chặn thiệt hại nghiêm trọng. Theo thời gian, các mô hình này sẽ giúp các nhà phát triển xây dựng phần mềm an toàn hơn nhiều bằng cách phát hiện lỗi trước khi mã được phát hành. Hiện tại, Anthropic cho biết các nhóm phần mềm nên rút ngắn chu kỳ vá lỗi và làm cho các bản cập nhật dễ dàng nhất có thể cho người dùng. Các nhà bảo vệ mạng nên tuân thủ các nguyên tắc cơ bản: xác thực đa yếu tố, cấu hình được tăng cường và ghi nhật ký kỹ lưỡng. Tin tức AI không cường điệu – Được tuyển chọn bởi con người Đăng ký THE DECODER để đọc không quảng cáo, nhận bản tin AI hàng tuần, báo cáo tiên phong "AI Radar" độc quyền của chúng tôi sáu lần một năm, truy cập toàn bộ kho lưu trữ và quyền truy cập vào phần bình luận của chúng tôi. Đăng ký ngay Nguồn: Anthropic

Anthropic cảnh báo Claude Mythos Preview phát hiện lỗi nhanh hơn tốc độ vá lỗi của nhà phát triển