Xây dựng tác nhân AI Phần 1: Xác định mục đích, thiết kế lời…

Những bước quan trọng đầu tiên quyết định liệu tác nhân AI của bạn thành công hay thất bại trong quá trình sản xuất — với các ví dụ thực tế từ ngân hàng, bán lẻ và chăm sóc sức khỏe Một công ty khởi nghiệp về chăm sóc sức khỏe đã dành sáu tháng để xây dựng tác nhân AI để phân loại bệnh nhân. Họ đã sử dụng mẫu GPT-4 mới nhất. Họ đã thuê các kỹ sư ML có kinh nghiệm. Họ xây dựng một giao diện đẹp. Bản demo đã gây ấn tượng với các nhà đầu tư. Sau đó, họ bắt đầu triển khai các phòng khám thực sự. Trong vòng vài ngày, các y tá đã ngừng sử dụng nó. Người đại diện hỏi những câu hỏi không liên quan. Nó đã bỏ lỡ các triệu chứng quan trọng. Nó cung cấp lời khuyên không nhất quán. Đôi khi họ quá thận trọng, gửi những bệnh nhân có vấn đề nhỏ đến phòng cấp cứu. Những lần khác nó quá hung hãn, bỏ qua những tình trạng nghiêm trọng. Vấn đề không phải là mô hình. Vấn đề không phải là mã. Vấn đề là nền tảng. Họ đã bỏ qua những bước quan trọng đầu tiên. Họ không bao giờ xác định đúng mục đích. Họ lao vào thiết kế nhanh chóng. Họ đã chọn sai cấu hình mô hình. Ba tháng và làm lại đáng kể sau đó, họ đã làm đúng. Ngày nay, đại lý của họ xử lý hơn 10.000 tương tác với bệnh nhân hàng ngày với tỷ lệ y tá hài lòng là 94% và kết quả bệnh nhân tốt hơn có thể đo lường được. Bài viết này đề cập đến ba bước nền tảng để xác định xem tác nhân AI của bạn thành công hay thất bại: xác định mục đích, thiết kế lời nhắc và chọn mô hình. Hãy làm đúng những điều này và mọi thứ khác sẽ trở nên dễ dàng hơn. Nếu hiểu sai thì không có kỹ thuật nào có thể cứu được bạn. Đây là một phần của loạt bài về Tác nhân AI sản xuất tòa nhà: Hướng dẫn kiến trúc hoàn chỉnh, trong đó chúng tôi hướng dẫn khuôn khổ 8 bước để đưa các tác nhân từ ý tưởng đến triển khai, với các mẫu và ví dụ thực tế về ngân hàng, chăm sóc sức khỏe, bán lẻ, sản xuất và hơn thế nữa. Bước 1: Xác định mục đích và phạm vi Trước khi viết một dòng mã, bạn phải trả lời chính xác bốn câu hỏi: Bạn đang giải quyết vấn đề gì? Người dùng của bạn là ai? Thành công trông như thế nào? Những hạn chế của bạn là gì? Những câu trả lời mơ hồ dẫn đến dự án thất bại. Câu trả lời cụ thể dẫn đến hệ thống sản xuất. Xác định trường hợp sử dụng phù hợp Không phải mọi vấn đề đều cần đến tác nhân AI. Hệ thống dựa trên quy tắc hoạt động tốt hơn đối với quy trình làm việc đơn giản. Các mô hình ML truyền thống hoạt động tốt hơn cho các nhiệm vụ dự đoán thuần túy. Các chuyên gia về con người làm việc tốt hơn cho các quyết định quan trọng đòi hỏi trách nhiệm giải trình. Nhân viên AI vượt trội khi bạn cần tự động đưa ra quyết định trong các quy trình làm việc phức tạp, gồm nhiều bước với quyền truy cập vào nhiều nguồn thông tin và công cụ. Hãy xem xét một kịch bản phát hiện gian lận ngân hàng. Một quy tắc đơn giản sẽ phát hiện các hình thức gian lận rõ ràng như giao dịch trùng lặp hoặc những điều kiện không thể xảy ra về mặt địa lý. Nhưng gian lận tinh vi đòi hỏi phải điều tra. Nhân viên phải phân tích lịch sử giao dịch, so sánh với các mẫu hành vi của khách hàng, kiểm tra cơ sở dữ liệu danh tiếng của người bán, tính toán điểm rủi ro bằng nhiều mô hình, tương quan với các mạng lừa đảo đã biết và tạo các gói bằng chứng để con người đánh giá. Điều này đòi hỏi quyền tự chủ (hoạt động 24/7 với hàng nghìn giao dịch), sử dụng công cụ (truy cập nhiều cơ sở dữ liệu và API), lý luận (kết nối các tín hiệu khác nhau) và điều phối quy trình làm việc (quy trình điều tra nhiều bước). Hoàn hảo cho một nhân viên hỗ trợ AI. Ngược lại điều này với một truy vấn dịch vụ khách hàng đơn giản như kiểm tra số dư tài khoản. Điều đó cần một lệnh gọi API cơ bản chứ không phải một tác nhân tự trị. Hãy sử dụng giải pháp đơn giản nhất có hiệu quả. Hiểu nhu cầu của người dùng Người dùng của bạn xác định kiến trúc của bạn. Kỹ thuật viên hiện trường cần truy cập di động với khả năng ngoại tuyến. Một nhà phân tích dữ liệu cần có bảng điều khiển với khả năng điều tra chi tiết. Hệ thống tự động cần có các API rõ ràng với các định dạng phản hồi có thể dự đoán được. Trong quản lý hàng tồn kho bán lẻ, người quản lý cửa hàng cần những đề xuất đơn giản mà họ có thể chấp nhận hoặc ghi đè. “Đặt hàng lại 150 đơn vị Sản phẩm X trước thứ Sáu” có thể thực hiện được. “Điểm tối ưu hóa hàng tồn kho: 0,847” là vô ích. Nhân viên phải nói được ngôn ngữ của người dùng và phù hợp với quy trình làm việc của họ. Đối với các cơ quan giám sát nông nghiệp phục vụ nông dân sản xuất nhỏ ở khu vực nông thôn, hãy xem xét các hạn chế về khả năng kết nối. Nhân viên có thể cần thông báo qua SMS thay vì bảng điều khiển web. Nó phải hoạt động với internet không liên tục. Nó phải cung cấp lời khuyên hữu ích bằng ngôn ngữ địa phương. “Chiều nay kiểm tra trường 3 về thiệt hại do sâu bệnh gây ra” đánh bại “Phát hiện bất thường ở khu vực 3 với độ tin cậy 0,73.” Bác sĩ lâm sàng chăm sóc sức khỏe cần các giao diện khác với bệnh nhân. Một bác sĩ xem xét các khuyến nghị về đại lý cần có lý luận lâm sàng chi tiết, điểm tin cậy và tài liệu tham khảo về tài liệu y khoa. Bệnh nhân cần được giải thích đơn giản và các bước tiếp theo rõ ràng. Cùng một tác nhân cơ bản, giao diện khác nhau. S đặt tiêu chí thành công Những mục tiêu mơ hồ như “nâng cao hiệu quả” đảm bảo thất bại. Các mục tiêu có thể đo lường được sẽ thúc đẩy các quyết định. Đối với một nhân viên kiểm soát chất lượng sản xuất, thành công có thể có nghĩa là: phát hiện 95% lỗi mà người kiểm tra phát hiện, giảm tỷ lệ dương tính giả xuống dưới 10%, xử lý dữ liệu kiểm tra trong vòng 2 giây cho mỗi mặt hàng, giảm 30% tỷ lệ thoát lỗi tổng thể, duy trì 99,9% thời gian hoạt động trong giờ sản xuất. Những con số này định hình mọi quyết định kiến trúc. Yêu cầu độ trễ 2 giây loại trừ một số mô hình nhất định. Tỷ lệ phát hiện 95% yêu cầu dữ liệu đào tạo mở rộng. Thời gian hoạt động 99,9% yêu cầu dự phòng và xử lý lỗi. Đối với một đại lý bảo trì hàng không, tiêu chí thành công bao gồm các khía cạnh khác nhau: dự đoán lỗi linh kiện trước 30 ngày với độ chính xác 80%, giảm 40% các sự cố bảo trì đột xuất, đảm bảo tuân thủ 100% quy định trong các khuyến nghị bảo trì, không bao giờ khuyến nghị trì hoãn việc bảo trì quan trọng về an toàn, tạo ra các bản kiểm tra hoàn chỉnh cho tất cả các quyết định. Yêu cầu tuân thủ 100% đòi hỏi phải kiểm tra nghiêm ngặt và có sự giám sát của con người. Ràng buộc an toàn tới hạn đòi hỏi các ngưỡng quyết định thận trọng. Đây là những yêu cầu về kiến trúc chứ không phải những yêu cầu tối ưu hóa sau triển khai. Xác định các ràng buộc Mọi hệ thống sản xuất đều phải đối mặt với những hạn chế. Các ràng buộc kỹ thuật như yêu cầu về độ trễ, hạn chế về cơ sở hạ tầng và yêu cầu tích hợp. Những hạn chế trong kinh doanh như ngân sách, dòng thời gian và khả năng tổ chức. Hạn chế về quy định như da

Xây dựng tác nhân AI Phần 1: Xác định mục đích, thiết kế lời nhắc và lựa chọn mô hình