Bộ nhớ tác nhân AI cho SaaS AI
Hướng dẫn triển khai SaaS · Bộ nhớ tác nhân · Quản lý ngữ cảnh · Kiến trúc quy trình làm việc
Tính năng AI SaaS hữu ích tiếp theo sẽ không chỉ trả lời nhanh hơn. Nó sẽ ghi nhớ những điều đúng đắn, quên đi những điều rủi ro và giải thích lý do tại sao một chi tiết trong quá khứ đang được sử dụng.
Hầu hết các bản demo AI SaaS đều trông ấn tượng trong năm phút. Tác nhân mở một phiếu yêu cầu, soạn thảo một phản hồi, cập nhật trường CRM và tóm tắt cuộc gọi của khách hàng. Sau đó, một người dùng thực yêu cầu nó tiếp tục quy trình làm việc tương tự vào ngày mai, với một khách hàng khác, sau ba thay đổi chính sách, hai luồng Slack và một email giận dữ.
Đó là nơi
Bộ nhớ tác nhân AI cho SaaS (Phần mềm dưới dạng dịch vụ)
Hướng dẫn triển khai AI SaaS · Bộ nhớ tác nhân · Quản lý ngữ cảnh · Kiến trúc quy trình làm việc
Tính năng AI SaaS hữu ích tiếp theo sẽ không chỉ trả lời nhanh hơn. Nó sẽ ghi nhớ những điều đúng đắn, quên đi những điều rủi ro và giải thích lý do tại sao một chi tiết trong quá khứ đang được sử dụng.
Hầu hết các bản demo AI SaaS trông rất ấn tượng trong năm phút. Tác nhân mở một phiếu yêu cầu, soạn thảo một phản hồi, cập nhật một trường CRM và tóm tắt một cuộc gọi của khách hàng. Sau đó, một người dùng thực yêu cầu nó tiếp tục quy trình làm việc tương tự vào ngày mai, với một khách hàng khác, sau ba thay đổi chính sách, hai luồng Slack và một email giận dữ.
Đó là lúc bản demo bị lỗi. Không phải vì mô hình yếu. Nó bị lỗi vì sản phẩm không có lớp bộ nhớ nghiêm túc.
Bộ nhớ tác nhân AI đang trở thành một trong những phần quan trọng thầm lặng quyết định sự thành bại của kiến trúc SaaS. Các nhà phát triển đã nhận thấy những khó khăn: cửa sổ ngữ cảnh quá nhỏ, truy xuất mang lại thông tin sai lệch, tùy chọn người dùng bị trộn lẫn với chính sách công ty, các quyết định cũ vẫn tồn tại sau khi chúng lẽ ra phải hết hạn và các tác nhân tự tin hành động dựa trên ngữ cảnh lỗi thời. Kết quả còn tệ hơn một chatbot trống rỗng. Một chatbot trống rỗng thì gây khó chịu. Một tác nhân ghi nhớ kém thì nguy hiểm.
Hướng dẫn này dành cho các nhà sáng lập SaaS, nhà phát triển và nhà xây dựng tự động hóa AI muốn có bộ nhớ giúp người dùng mà không gây ra sự lộn xộn về quyền riêng tư, bảo mật hoặc độ tin cậy. Nó không phụ thuộc vào nhà cung cấp và mang tính thực tế. Không có quảng cáo sản phẩm. Không có sơ đồ cơ sở dữ liệu thần kỳ. Chỉ là những quyết định kiến trúc quan trọng khi một tác nhân AI cần ghi nhớ trong một quy trình làm việc SaaS thực tế.
Tại sao bộ nhớ tác nhân AI đột nhiên trở thành một vấn đề SaaS nghiêm trọng
Các xu hướng công cụ AI gần đây đều chỉ ra cùng một hướng. Các nhà phát triển đang thử nghiệm các hệ điều hành cá nhân mã nguồn mở kết hợp các ứng dụng, tệp, trợ lý và bộ nhớ dài hạn. Các khung tác nhân đang được đánh giá không chỉ dựa trên khả năng truy cập mô hình mà còn dựa trên khả năng gỡ lỗi, kiểm soát của con người, độ trễ, thực thi phân tán và các hệ thống bộ nhớ tốt hơn. Các công cụ kiểu MCP mới, tác nhân quy trình làm việc và ý tưởng SaaS gốc AI đang đẩy các tác nhân sâu hơn vào các hệ thống kinh doanh.
Đồng thời, các nhóm đang chịu áp lực phải chứng minh ROI của AI, giảm lãng phí token, bảo vệ dữ liệu riêng tư và tránh giao quá nhiều quyền kiểm soát cho một tác nhân không thể đoán trước. Điều đó tạo ra một khoảng trống tìm kiếm thực tế: rất nhiều nội dung nói "thêm bộ nhớ vào tác nhân AI của bạn", nhưng không đủ giải thích cách các nhà xây dựng SaaS nên quyết định bộ nhớ có nghĩa là gì, nó nằm ở đâu, nó được xác minh như thế nào và khi nào hệ thống nên quên.
Bộ nhớ AI hữu ích không phải là một lời nhắc lớn hơn. Nó là một hợp đồng sản phẩm giữa người dùng, quy trình làm việc, lớp dữ liệu và tác nhân. Đối với SaaS, bộ nhớ không phải là một thứ duy nhất. Nó là một tập hợp các loại ngữ cảnh khác nhau với các thời gian tồn tại, quyền hạn và mức độ rủi ro khác nhau. Xử lý tất cả chúng như "lịch sử trò chuyện cộng với tìm kiếm vector" là cách các nhóm tạo ra các tác nhân cảm thấy thông minh trong thử nghiệm và bất cẩn trong sản xuất.
Bốn loại bộ nhớ mà mọi nhà xây dựng AI SaaS nên phân tách
Sai lầm thiết kế đầu tiên là lưu trữ mọi thứ trong một thùng. Tùy chọn thanh toán của khách hàng, tùy chọn giọng điệu của người dùng, một bản nháp tạm thời, một chính sách hỗ trợ và một cuộc gọi công cụ không thành công không nên hoạt động theo cùng một cách. Chúng không nên có cùng thời gian lưu giữ. Chúng không nên được truy xuất với cùng độ tin cậy. Chúng không nên hiển thị cho cùng một người dùng.
1. Bộ nhớ phiên
Bộ nhớ phiên là ngữ cảnh làm việc ngắn hạn cho tác vụ hiện tại. Nó bao gồm cuộc trò chuyện, trang hiện tại, bản ghi đã chọn, đầu ra nháp, các cuộc gọi công cụ gần đây và các giả định tạm thời. Nó phải dễ kiểm tra và an toàn để loại bỏ.
Ví dụ, nếu người dùng yêu cầu một AI hỗ trợ soạn thảo phản hồi hoàn tiền, bộ nhớ phiên có thể bao gồm phiếu yêu cầu đang mở, các tin nhắn gần đây của khách hàng, đoạn trích chính sách hoàn tiền và bản nháp của nhân viên. Khi phiếu yêu cầu được đóng, hầu hết bộ nhớ đó không nên trở thành vĩnh viễn.
2. Bộ nhớ tùy chọn người dùng
Bộ nhớ tùy chọn người dùng ghi lại cách một người muốn công việc được thực hiện. Điều này có thể bao gồm tông giọng viết ưa thích, định dạng báo cáo mặc định, kiểu thông báo, múi giờ, các phím tắt quy trình làm việc yêu thích hoặc các ràng buộc định kỳ.
Bộ nhớ này phải có thể chỉnh sửa được bởi người dùng. Nó cũng nên khiêm tốn. "Sử dụng các bản tóm tắt súc tích" là hữu ích. "Người dùng này không thích tất cả khách hàng doanh nghiệp" không phải là một tùy chọn an toàn để lưu trữ hoặc áp dụng một cách mù quáng.
3. Bộ nhớ không gian làm việc
Bộ nhớ không gian làm việc thuộc về một nhóm, tài khoản, đối tượng thuê hoặc tổ chức. Nó có thể bao gồm các quy tắc sản phẩm, sổ tay thành công của khách hàng, quy ước đặt tên, quy tắc leo thang, tiêu chí đủ điều kiện bán hàng, định nghĩa dữ liệu và các chuẩn mực quy trình làm việc nội bộ.
Đây là nơi SaaS đa đối tượng thuê trở nên phức tạp. Bộ nhớ không gian làm việc phải tôn trọng các vai trò. Một nhân viên hỗ trợ không nên truy xuất các ghi chú tài chính chỉ dành cho cấp điều hành. Một AI hướng tới khách hàng không nên sử dụng các ghi chú bảo mật nội bộ trong một câu trả lời. Một nhà thầu không nên thừa hưởng cùng một bộ nhớ như một quản trị viên.
4. Bộ nhớ kiến thức miền
Bộ nhớ miền là lớp kiến thức ổn định hơn của sản phẩm. Nó bao gồm tài liệu, tài liệu tham khảo API, nội dung trung tâm trợ giúp, hướng dẫn tích hợp, chính sách và tài liệu nguồn đã được xác minh. Trong nhiều sản phẩm SaaS, điều này được triển khai bằng cách tạo sinh tăng cường truy xuất (RAG), nhưng điểm quan trọng không phải là từ viết tắt. Điểm quan trọng là kiến thức miền phải được lấy nguồn, lập phiên bản và có cơ sở.
Khi các loại bộ nhớ này được giữ riêng biệt, tác nhân có thể hành xử thông minh hơn. Nó có thể nói, "Tôi đang sử dụng tùy chọn cá nhân của bạn," "Tôi tìm thấy điều này trong sổ tay nhóm," hoặc "Điều này đến từ tài liệu chính sách hiện hành." Lời giải thích đó xây dựng lòng tin.
Một kiến trúc thực tế cho bộ nhớ tác nhân AI
Bạn không cần một kiến trúc phức tạp để bắt đầu. Bạn cần một kiến trúc rõ ràng. Một hệ thống bộ nhớ hữu ích có năm lớp: thu thập, phân loại, lưu trữ, truy xuất và xác minh.
Thu thập: quyết định những gì đủ điều kiện để trở thành bộ nhớ
Không phải mọi tương tác đều nên trở thành bộ nhớ. Lớp thu thập quyết định những sự kiện nào là ứng cử viên. Các ứng cử viên tốt bao gồm các hướng dẫn rõ ràng của người dùng, các mẫu quy trình làm việc lặp lại, cài đặt tài khoản đã được xác minh, các bản cập nhật sổ tay đã được phê duyệt và các dữ kiện khách hàng bền vững. Các ứng cử viên yếu bao gồm các bình luận cảm xúc một lần, các sự cố ngẫu nhiên.
Nguồn tin: Medium Towards AI — Tác giả: Anna Jey. Bản dịch tiếng Việt do AI thực hiện, có thể có sai sót.