Cloudflare cho biết Mythos Preview của Anthropic đã phát hiện…

Cloudflare đã thử nghiệm mô hình AI tập trung vào bảo mật Mythos Preview của Anthropic trên hơn 50 kho mã nguồn của mình, trong khuôn khổ Dự án Glasswing. Bài viết Cloudflare cho biết Mythos Preview của Anthropic tìm thấy các chuỗi khai thác mà các mô hình tiên tiến trước đây đã bỏ sót, xuất hiện lần đầu trên The Decoder.

Cloudflare cho biết Mythos Preview của Anthropic phát hiện các chuỗi khai thác mà các mô hình tiên tiến trước đây đã bỏ lỡ Maximilian Schreiner Ngày 19/5/2026 Cloudflare đã thử nghiệm mô hình AI Mythos Preview tập trung vào bảo mật của Anthropic trên hơn 50 kho mã nguồn của mình như một phần của Project Glasswing. Mô hình này có thể xâu chuỗi nhiều lỗ hổng nhỏ thành các khai thác hoạt động và chứng minh tính xác thực của chúng bằng cách tự viết, biên dịch và chạy mã bằng chứng khái niệm (proof-of-concept). Theo Grant Bourzikas, Giám đốc An ninh Thông tin (CSO) của Cloudflare, các mô hình tiên tiến trước đây đã tìm thấy các lỗi riêng lẻ tương tự và đôi khi đưa ra phân tích chắc chắn. Tuy nhiên, chúng không thể kết nối các mảnh ghép lại với nhau, để lại các chuỗi chưa hoàn chỉnh và câu hỏi về khả năng khai thác thực tế vẫn còn bỏ ngỏ. Mythos Preview tạo ra ít phát hiện mang tính suy đoán hơn, các bước rõ ràng hơn để tái tạo vấn đề và cần ít sự theo dõi của con người hơn để đưa ra quyết định khắc phục hoặc loại bỏ. Cloudflare nhấn mạnh rằng một tác nhân duy nhất là không đủ. Công ty đã xây dựng một hệ thống đa giai đoạn (multi-stage harness) với tối đa 50 tác nhân song song và đánh giá đối kháng, trong đó một tác nhân thứ hai cố gắng bác bỏ từng phát hiện. Công ty cũng cảnh báo: những khả năng tương tự này cũng sẽ có sẵn cho những kẻ tấn công.

Cloudflare cho biết Mythos Preview của Anthropic đã phát hiện ra các chuỗi khai thác mà các mô hình tiên tiến trước đây bỏ sót.