Bỏ qua tới nội dung chính
Quay lại tin tức

Hybrid AI: Kết hợp phân tích xác định với suy luận của LLM

Towards Data Science· Ingo Nowitzky· 22/5/2026general

Kiến trúc AI ngăn chặn các phân tích hợp lý nhưng sai lệch Bài viết Hybrid AI: Kết hợp phân tích xác định với suy luận LLM xuất hiện lần đầu trên Towards Data Science.

AI Tác nhân AI lai: Kết hợp phân tích xác định với suy luận của LLM Kiến trúc AI ngăn chặn các phân tích hợp lý nhưng sai lệch như thế nào Ingo Nowitzky Ngày 22/5/2026 19 phút đọc Chia sẻ Được tạo bởi tác giả sử dụng ChatGPT Giới thiệu Tôi đã cố gắng xây dựng một mạng lưới AI tác nhân cho công ty của mình để tư vấn cho các nhà máy sản xuất về cách nâng cao hoạt động của họ. Hệ thống được thiết kế theo hướng dữ liệu, cho phép người dùng tải dữ liệu đánh giá trực tiếp thông qua giao diện trò chuyện. Nguyên mẫu hoạt động đầu tiên đã hoàn thành một cách đáng ngạc nhiên nhanh chóng, và thoạt nhìn, kết quả có vẻ đầy hứa hẹn. Chỉ có một vấn đề: Hầu hết các kết quả đều sai! Tệ hơn nữa, AI nhanh chóng học được những phạm vi số nào trông có vẻ hợp lý và bắt đầu tạo ra các kết quả thuyết phục – nhưng bịa đặt. Kết hợp với khả năng tạo ngôn ngữ hùng hồn của LLM, những kết quả này có thể dễ dàng bị nhầm lẫn là sự thật. Và hành vi này không chỉ giới hạn ở một mô hình duy nhất. Các mô hình tương tự xuất hiện trên tất cả các hệ thống đã thử nghiệm: ChatGPT, Gemini Enterprise, DIA Brain và Microsoft Copilot. Tuy nhiên, dữ liệu hợp lý là chưa đủ, các hệ thống AI doanh nghiệp yêu cầu dữ liệu đáng tin cậy! Điều tra thêm đã tiết lộ các chế độ lỗi lặp lại. Ngay cả khi đã bật “Code Interpreter”, các hệ thống vẫn: bỏ qua hàng hoặc cột, áp dụng các bộ lọc không chính xác, trả về kết quả giống hệt nhau cho các đầu vào khác nhau, âm thầm trộn lẫn các phần của tập dữ liệu, hoặc đơn giản là sụp đổ dưới các tác vụ phân tích phức tạp hơn. Điều này dẫn đến một nhận thức quan trọng: Suy luận xác suất cực kỳ mạnh mẽ cho việc diễn giải và tương tác – nhưng phân tích dữ liệu cơ bản yêu cầu thực thi xác định. Mục lục 1 Trường hợp sử dụng 2 Kiến trúc lai 3 Công cụ lập kế hoạch phân tích 4 Công cụ phân tích 5 Một ví dụ từ đầu đến cuối 6 Tại sao kiến trúc AI lại quan trọng 1 Trường hợp sử dụng Mặc dù trường hợp sử dụng cụ thể có tầm quan trọng thứ yếu, nhưng nó được phác thảo ngắn gọn ở đây để hỗ trợ sự hiểu biết thực tế về thách thức kiến trúc cơ bản. Nhiệm vụ chính của tác nhân của chúng tôi là tư vấn cho các nhà máy sản xuất và chuỗi giá trị về cách cải thiện mức độ trưởng thành hoạt động của họ: tối ưu hóa quy trình, cải thiện năng suất, giảm mức tồn kho và cuối cùng là giảm chi phí vận hành. Để đạt được điều này, tác nhân tư vấn hoạt động ở hai chế độ: Nó cung cấp các khuyến nghị chung để cải thiện các chủ đề hoạt động cụ thể dựa trên việc truy xuất tài liệu “hướng dẫn” chuyên biệt và bảng câu hỏi đánh giá. Tác nhân được thiết kế để phân tích tình hình hiện tại của một nhà máy hoặc chuỗi giá trị dựa trên kết quả đánh giá và các khuyến nghị bằng văn bản của người đánh giá. Dựa trên phân tích này, nó được kỳ vọng sẽ cung cấp các khuyến nghị rất cụ thể cho các bước cải tiến tiếp theo. Ở cả hai chế độ – cũng như với hầu hết các mô hình AI dựa trên LLM – người dùng có thể tương tác thảo luận các ý tưởng và khuyến nghị với tác nhân để đưa ra kế hoạch hành động phù hợp nhất. Đối với chế độ hoạt động thứ hai, điều cần thiết là tác nhân có thể xử lý và phân tích dữ liệu đánh giá một cách đáng tin cậy. Trong trường hợp của chúng tôi, dữ liệu này được cung cấp dưới dạng xuất Excel từ một cơ sở dữ liệu trung tâm. Lý tưởng nhất là tác nhân có thể xử lý tệp mà không cần chuẩn bị thủ công trước. Tuy nhiên, cấu trúc của tệp gây nhiều thách thức. Do tất cả kết quả đánh giá, tính toán trung gian, siêu dữ liệu và các câu hỏi đánh giá chi tiết đều được lưu trữ trong các cột riêng biệt, bảng tính chứa hơn 800 cột. Số lượng hàng tương ứng với số lượng đánh giá trong cơ sở dữ liệu và có thể dao động từ một đến vài trăm (Hình 1). Xếp hạng đánh giá được biểu thị bằng số nguyên từ 0 đến 4. Ngoài ra, tệp chứa hơn 160 trường văn bản tự do với các quan sát định tính, điểm mạnh, điểm yếu và khuyến nghị từ các chuyên gia đánh giá. Hình 1: Cấu trúc dữ liệu đánh giá | hình ảnh do tác giả cung cấp Các tác vụ phân tích của tác nhân bao gồm lọc các hàng và cột liên quan cho một yêu cầu cụ thể, tính toán giá trị trung bình, tổng hợp điểm trưởng thành, tóm tắt các khuyến nghị bằng văn bản và đưa ra các đề xuất cải tiến có ý nghĩa từ kết quả. Ban đầu, các tác vụ này dường như nằm trong khả năng của các hệ thống AI dựa trên LLM hiện đại, đặc biệt khi bật chế độ “Code interpreter”. Như đã đề cập trong phần giới thiệu, giả định này nhanh chóng trở thành một quan niệm sai lầm. 2 Kiến trúc lai Ý tưởng cốt lõi để vượt qua thách thức phân tích là tách biệt rõ ràng phân tích dữ liệu xác định khỏi suy luận và diễn giải dựa trên LLM. Hình 2 cho thấy kiến trúc hệ thống được chọn sau nhiều lần cải tiến. Hệ thống được triển khai trong Microsoft Copilot Studio vì nền tảng này cho phép kết hợp các yếu tố quy trình làm việc xác định, như chủ đề và luồng, với các thành phần suy luận dựa trên LLM. Hình 2: Kiến trúc hệ thống của tác nhân tư vấn với mô-đun phân tích tích hợp | hình ảnh do tác giả cung cấp Tác nhân chính xử lý tất cả các giao tiếp với người dùng. Nó điều phối các tác nhân phụ và mô-đun phân tích, ủy quyền các tác vụ cho chúng, nhận phản hồi của chúng và tổng hợp câu trả lời cuối cùng. Các tác nhân phụ là các mô-đun dựa trên LLM chuyên biệt có quyền truy cập vào các nguồn kiến thức cụ thể. Chúng bao gồm mô tả về kỳ vọng cấp độ trưởng thành cho các luồng giá trị, bảng câu hỏi với các câu hỏi đánh giá chi tiết và các hướng dẫn chung hơn về sự xuất sắc trong vận hành. Các tác nhân phụ được tác nhân chính gọi theo khả năng cụ thể của chúng và phản hồi lại tác nhân chính thay vì trực tiếp cho người dùng. Mô-đun phân tích là trọng tâm chính của bài viết này. Nó thực hiện phân tích dữ liệu xác định và được thiết kế để cung cấp kết quả phân tích có thể tái tạo và đáng tin cậy. Nó nhận một hướng dẫn phân tích bằng ngôn ngữ tự nhiên từ tác nhân chính, được gọi là Parent_Instruction. Bản thân mô-đun phân tích bao gồm các chủ đề, luồng và mô-đun AI, được gọi là “prompts” trong Copilot Studio. Chủ đề T_receive_Excel_File xử lý việc tải lên.

Nguồn tin: Towards Data Science — Tác giả: Ingo Nowitzky. Bản dịch tiếng Việt do AI thực hiện, có thể có sai sót.