Mở rộng quy mô AI doanh nghiệp an toàn với các khuôn khổ quản…

Các khuôn khổ quản trị mới nhất của OpenAI cung cấp cho các nhà lãnh đạo doanh nghiệp một bản thiết kế có cấu trúc để mở rộng quy mô triển khai AI an toàn và tuân thủ trên toàn cầu. Việc áp dụng các mô hình ngôn ngữ lớn đã dần tiến tới yêu cầu một kiến trúc bền vững, cấp thương mại. OpenAI đã phát hành Khuôn khổ Quản trị Tiên phong (FGF), ghi lại cách tổ chức này giải quyết việc đánh giá và giảm thiểu rủi ro hệ thống. Khuôn khổ này liên kết trực tiếp với Bộ Quy tắc Thực hành AI Mục đích Chung của Liên minh châu Âu và Đạo luật Minh bạch về AI Tiên phong của California, được gọi là TFAIA. Ấn phẩm này cung cấp một mẫu thực tế cao, trình bày chi tiết cách các hệ thống nội bộ và quy trình triển khai có thể được cấu trúc để hỗ trợ các mô hình học máy có khả năng cao một cách an toàn. Việc chuyển đổi các cấu trúc quy định này thành chiến lược kinh doanh bắt đầu bằng việc hiểu các loại mối đe dọa được xác định. Khuôn khổ định nghĩa rủi ro hệ thống là các rủi ro vật chất có thể dự đoán được gây ra thiệt hại nghiêm trọng. Cụ thể, điều này bao gồm các kịch bản trong đó một mô hình góp phần gây ra hơn 50 trường hợp tử vong hoặc gây thiệt hại tài sản 1 tỷ USD từ một sự cố duy nhất. Mặc dù các kịch bản này nằm ở mức cực đoan của xác suất, việc mã hóa chúng cho phép các nhóm triển khai xây dựng các biện pháp bảo vệ phù hợp. Bằng cách xác định ranh giới sớm, các doanh nghiệp có thể phân bổ chính xác tài nguyên tính toán và giờ kỹ thuật cho việc giám sát liên tục sau triển khai và kiểm toán của bên thứ ba; đảm bảo các ứng dụng vẫn tuân thủ trong suốt vòng đời của chúng. Áp dụng đánh giá rủi ro theo cấp độ cho các hệ thống nội bộ OpenAI phân loại các mối đe dọa trên các lĩnh vực cụ thể: tấn công mạng, rủi ro hóa học, sinh học, phóng xạ và hạt nhân (CBRN), thao túng gây hại và mất kiểm soát. Hệ thống phân loại sử dụng các cấp độ rủi ro riêng biệt để đánh giá khả năng của mô hình. Ví dụ, xếp hạng tấn công mạng Cấp 3 áp dụng cho một mô hình được tăng cường công cụ có khả năng xác định và phát triển các lỗ hổng zero-day chức năng ở tất cả các mức độ nghiêm trọng trong nhiều hệ thống thực tế được bảo vệ mà không cần sự can thiệp của con người. Trong danh mục CBRN, một mô hình Cấp 3 có thể cho phép một chuyên gia phát triển một vectơ đe dọa mới rất nguy hiểm, tương đương với tác nhân sinh học Loại A của CDC, hoặc tự động hoàn thành chu trình tổng hợp của một mối đe dọa sinh học được quy định. Thay vì coi những khả năng này chỉ là mối nguy hiểm, các nhóm bảo mật nội bộ có thể sử dụng các cấp độ này để thiết lập giới hạn xác định cho các phiên bản mô hình độc quyền của họ, biết chính xác khi nào một trợ lý mã hóa hoặc công cụ nghiên cứu yêu cầu giám sát chặt chẽ hơn. Khuôn khổ cũng nêu ra các rủi ro liên quan đến thao túng gây hại, được mô tả là sự bóp méo có chủ đích hành vi của con người, chẳng hạn như sử dụng khả năng của mô hình cho các hoạt động gây ảnh hưởng hoặc can thiệp bầu cử. OpenAI lưu ý rằng lĩnh vực này vẫn đang được khám phá và tốt nhất nên được giải quyết thông qua các biện pháp giảm thiểu cấp hệ thống, như giám sát sau triển khai, thay vì đánh giá trước triển khai. Đối với các doanh nghiệp hướng tới người tiêu dùng, điều này cho thấy các hệ thống tự động hóa tiếp thị sử dụng mô hình ngôn ngữ chỉ yêu cầu bộ phân loại nội dung thời gian thực để đảm bảo chúng tạo ra thông điệp công khai khách quan. Giải quyết rủi ro con người mất khả năng chỉ đạo hoặc tắt hệ thống một cách đáng tin cậy, khuôn khổ này dán nhãn vectơ này là mất kiểm soát. Một mô hình Cấp 2 trong danh mục này thể hiện khả năng đáng tin cậy để tránh bị phát hiện trên nhiều phương pháp đánh giá khác nhau, bao gồm cả việc tránh giám sát chuỗi suy nghĩ. Một mô hình Cấp 3 được mô tả là vượt trội hơn so với những chuyên gia giỏi nhất trong việc thực hiện hầu hết các dự án phức tạp và có thể hoạt động tự chủ trong thời gian dài, liên tục. Mô hình này thể hiện nhận thức tình huống chi tiết cao và khả năng ẩn mình, đến mức việc giám sát mô hình và chuỗi suy nghĩ của nó không thể phát hiện hoặc loại trừ một cách đáng tin cậy việc né tránh sự kiểm soát của con người. Bằng cách thiết lập các thông số này, các doanh nghiệp dựa vào các tác nhân tự động cho logistics chuỗi cung ứng hoặc giao dịch tài chính có một nhiệm vụ rõ ràng là xây dựng các cơ chế an toàn dự phòng xác định và duy trì sự giám sát nhất quán của con người trong các quy trình làm việc tự động. Giải quyết các thách thức tích hợp và an ninh thông tin OpenAI điều chỉnh an ninh nội bộ của mình theo các tiêu chuẩn ISO 27001, 27017, 27018 và 27701, cùng với các đánh giá SOC 2 Loại II. Để bảo vệ các trọng số mô hình chưa được phát hành, công ty sử dụng mã hóa cho dữ liệu khi lưu trữ và khi truyền tải, xác thực đa yếu tố và các giao thức phê duyệt đa bên nghiêm ngặt. Nhân viên nội bộ được đào tạo thường xuyên, và việc thực thi mô hình diễn ra trong một môi trường hộp cát với quyền truy cập ra ngoài bị hạn chế theo mặc định. Khi các doanh nghiệp sao chép thiết lập này, họ thiết lập một nền tảng an toàn cho các hoạt động nội bộ. Việc tích hợp các mô hình vào môi trường dữ liệu độc quyền của công ty thường khiến các nhóm kỹ thuật phải dựa vào Retrieval-Augmented Generation (Tạo sinh tăng cường truy xuất) và các cơ sở dữ liệu vector dày đặc. Bảo mật các cơ sở dữ liệu này chống lại các lời nhắc đối kháng hoặc các nỗ lực trích xuất dữ liệu đòi hỏi chi phí tính toán chuyên dụng. Mọi yêu cầu API đều đi qua các bộ phân loại bảo mật trước khi đến cơ sở dữ liệu vector, và ngữ cảnh được truy xuất được sàng lọc trước khi tạo ra phản hồi cuối cùng. Mặc dù việc kết nối các cấu trúc quản trị AI hiện đại được lưu trữ trên đám mây với các silo dữ liệu mainframe cũ hơn buộc các nhóm phải xây dựng phần mềm trung gian tùy chỉnh, được mã hóa mạnh mẽ, nhưng công việc kỹ thuật này mang lại cơ sở hạ tầng ổn định sẵn sàng cho doanh nghiệp. Duy trì tuân thủ hệ sinh thái và ứng phó sự cố Để duy trì các đường cơ sở rủi ro chính xác, OpenAI tìm kiếm ý kiến đóng góp từ các chuyên gia lĩnh vực bên ngoài và các nhà đánh giá bên thứ ba độc lập. Các chuyên gia bên ngoài này giúp kiểm tra căng thẳng các biện pháp bảo vệ cho các mô hình sắp đạt đến một cấp độ rủi ro mới và cung cấp ý kiến độc lập cho Nhóm Tư vấn An toàn nội bộ. Các CDO (Giám đốc Dữ liệu) trong các doanh nghiệp cũng có thể hưởng lợi tương tự từ các hợp đồng kiểm toán bên ngoài để xác minh độc lập rằng việc triển khai mô hình cục bộ của họ vẫn nằm trong ngưỡng rủi ro chấp nhận được. Kết nối với hệ sinh thái quy định rộng lớn hơn, báo cáo bên ngoài quy định nhịp độ hoạt động liên tục. OpenAI ghi lại kết quả giảm thiểu của mình trong Báo cáo Mô hình An toàn và Bảo mật.

Mở rộng quy mô AI doanh nghiệp an toàn với các khuôn khổ quản trị của OpenAI