Bỏ qua tới nội dung chính
Quay lại tin tức

Đại lý dữ liệu là gì?

Towards Data Science· Marina Tosic· 26/5/2026general

Một giải thích đơn giản về tác nhân dữ liệu và cách thức hoạt động Bài viết What Is a Data Agent? xuất hiện đầu tiên trên Towards Data Science.

AI tác nhân Đại lý dữ liệu là gì? Giải thích đơn giản về đại lý dữ liệu và cách thức hoạt động Marina Tosic Ngày 26/5/2026 5 phút đọc Chia sẻ Ảnh của Kelly Sikkema trên Unsplash Khi làm việc tại Microsoft, tôi có cơ hội thử nghiệm các công cụ phân tích mới được hỗ trợ bởi AI, bao gồm cả đại lý dữ liệu của Microsoft Fabric. Đó là lý do tôi muốn chia sẻ những gì mình đã học được, giải thích đại lý dữ liệu là gì và làm nổi bật sự khác biệt giữa nó với một tác nhân AI “tiêu chuẩn”. Vì vậy, không cần giới thiệu thêm, đây là định nghĩa của tôi về đại lý dữ liệu: Đại lý dữ liệu là một báo cáo mà bạn có thể trò chuyện. Đối với những người làm trong lĩnh vực phân tích, điều này có nghĩa là hai mong muốn đã ấp ủ từ lâu cuối cùng có thể trở thành hiện thực: 1: Các nhà phân tích dành ít thời gian hơn để xây dựng các biểu đồ trực quan. 2: Thông tin chi tiết tự phục vụ đến gần hơn với người dùng doanh nghiệp. Hãy để tôi giải thích chi tiết hơn về từng điểm này. Ít biểu đồ trực quan hơn, không phải ít thông tin chi tiết hơn Tôi thực sự thích một báo cáo tốt có thể cho tôi biết “điều gì đang xảy ra” với các chỉ số mà tôi đang quan tâm. Nhưng được đào tạo về phân tích, tôi biết đôi khi các báo cáo có thể làm sai lệch các chỉ số, khiến người dùng doanh nghiệp thường xuyên yêu cầu các nhà phân tích giải thích KPI, thường là 10 phút trước các cuộc họp quan trọng. Và đó là một trong những lý do chúng ta thường rơi vào vòng luẩn quẩn của việc có các bảng điều khiển không ai sử dụng và các bên liên quan liên tục muốn “con số” được cung cấp ad hoc hoặc thông qua bảng tính. Mặt khác, các biểu đồ trực quan và bảng tính sẽ không biến mất, nhưng việc cung cấp thông tin chi tiết có một cách mới với đại lý dữ liệu Fabric. Thay vì gói các truy vấn trong biểu đồ, bạn có thể gói chúng trong các lời nhắc và hướng dẫn được ghép nối với kho dữ liệu được quản lý sẵn sàng để sử dụng trong Fabric, tức là trong một lakehouse, kho dữ liệu, mô hình ngữ nghĩa Power BI, cơ sở dữ liệu KQL hoặc thậm chí là một ontology. Điều này ngụ ý rằng dữ liệu cơ bản vẫn cần được chuẩn bị và mô hình hóa để trả lời các câu hỏi kinh doanh như “Doanh thu tuần này so với tuần trước là bao nhiêu?” Tuy nhiên, từ góc độ thiết kế, thay vì tạo một báo cáo trực quan có phạm vi để trả lời câu hỏi kinh doanh này, giờ đây bạn tạo một đại lý dữ liệu có phạm vi để cung cấp câu trả lời này và các tập hợp con khác của câu trả lời được lấy từ (các) mô hình dữ liệu cơ bản. Chính xác hơn, luồng đầu vào-đầu ra diễn ra như sau: (1) một bên liên quan đặt câu hỏi, (2) tác nhân, được hỗ trợ bởi API Azure OpenAI Assistant, diễn giải câu hỏi và “quyết định” nguồn dữ liệu nào có khả năng chứa câu trả lời nhất dựa trên lược đồ nguồn và hướng dẫn của tác nhân, (3) tạo truy vấn thích hợp (SQL, DAX hoặc KQL tùy thuộc vào loại nguồn), (4) xác thực nó, (5) thực thi nó dưới thông tin đăng nhập của bên liên quan và (6) trả về kết quả dưới dạng văn bản hoặc bảng, chưa phải là một biểu đồ trực quan. Tóm lại, tương tác của bên liên quan với thông tin chi tiết thông qua đại lý dữ liệu là một phiên hỏi đáp trên tập dữ liệu được quản lý, và các biểu đồ chi tiết có thể được thay thế bằng các câu hỏi tiếp theo, chẳng hạn như “Bạn có thể phân tích doanh thu theo phân khúc không?” Với điều đó, rõ ràng là công việc của các nhà phân tích không còn cần phải được thể hiện lại chỉ thông qua các bảng điều khiển, hay còn gọi là bằng chứng hữu hình đã được biết đến từ lâu rằng công việc nắm bắt logic kinh doanh trong các mô hình dữ liệu đã được thực hiện. Bây giờ, hãy nói về… Thông tin chi tiết tự phục vụ, gần hơn với nơi người dùng doanh nghiệp “sinh sống” Trước đây, tôi từng đề cập rằng các báo cáo đôi khi có thể trình bày sai lệch các số liệu, nhưng đó không phải là lý do duy nhất khiến câu nói "Nếu bạn xây dựng, họ sẽ đến" hiếm khi hiệu quả đối với các báo cáo hoặc phân tích nói chung. Thực tế là rào cản kiến thức thường quá cao để hiểu các mô hình ngữ nghĩa cơ bản và cách sử dụng các công cụ BI để tạo hình ảnh trực quan. Mặc dù điều này chỉ ra vấn đề về năng lực dữ liệu, vốn là một vấn đề quản lý thay đổi, nhưng thực tế là đối tượng kinh doanh mục tiêu, những người lẽ ra phải là người tiêu thụ báo cáo, thường có quá nhiều việc phải làm nên không bận tâm đến việc học các công cụ BI để tự phục vụ phân tích. Đó là lý do tại sao điều quan trọng là phải đưa thông tin chi tiết đến gần hơn với nơi người dùng cuối "sinh sống", mà ngày nay thường là các công cụ được hỗ trợ bởi AI như M365 Copilot. Với khả năng hiển thị thông tin chi tiết thông qua các tác nhân dữ liệu (data agents) bên ngoài Fabric, các nhà phân tích giờ đây có thể tập trung vào logic phân tích đằng sau các tác nhân dữ liệu tự phục vụ, và người dùng cuối có thể truy cập thông tin chi tiết trong các công cụ được hỗ trợ bởi AI tương tự hỗ trợ các tác vụ hàng ngày khác của họ, mà không gặp phải sự phức tạp khi phải chuyển sang một nền tảng khác. Tôi phải lưu ý rằng đây không phải là cách duy nhất để tích hợp các tác nhân dữ liệu Fabric vào quy trình làm việc, và bất kể bạn là nhà phát triển hay người tiêu dùng, điều quan trọng là phải biết... Sự khác biệt giữa tác nhân dữ liệu và tác nhân AI Ảnh của Dynamic Wang trên Unsplash Chúng ta đã biết rằng tác nhân dữ liệu Fabric là một tác nhân phân tích tập trung vào quyền truy cập dữ liệu chỉ đọc, được quản lý, có khả năng dịch các câu lệnh ngôn ngữ tự nhiên thành các truy vấn cơ sở dữ liệu phức tạp để mở khóa thông tin chi tiết, ngay cả bên ngoài hệ thống Fabric. Mặt khác, một tác nhân AI được định nghĩa là một hệ thống cho phép các Mô hình Ngôn ngữ Lớn (LLM) thực hiện các tác vụ, không chỉ phản hồi các câu lệnh, thay mặt người dùng hoặc các hệ thống khác bằng cách truy cập các công cụ và kiến thức. Điều đó có nghĩa là, toàn bộ sự kỳ diệu nằm ở việc thiết lập tác nhân AI, nơi bạn có thể sử dụng tác nhân dữ liệu Fabric như một công cụ hoặc nguồn kiến thức chuyên biệt. Tôi sẽ minh họa điều này bằng một ví dụ đơn giản. Hãy tưởng tượng một người dùng được ủy quyền yêu cầu tác nhân AI "Soạn một email gửi cho nhóm tóm tắt doanh thu tuần trước theo phân khúc." Để hoàn thành công việc này, tác nhân AI sẽ, trong số những việc khác, cần chuẩn bị thông tin chi tiết về doanh thu từ cơ sở dữ liệu doanh nghiệp. Vì vậy, nhằm giảm lỗi trong tính toán doanh thu, nhà phát triển sẽ thiết kế một quy trình làm việc tác nhân để định tuyến câu lệnh đầu vào đến công cụ tác nhân dữ liệu Fabric, công cụ này sẽ đảm nhiệm việc xác định lược đồ, viết truy vấn, thực thi nó và trả về các số liệu chính xác. Cuối cùng, tác nhân AI sẽ sử dụng các số liệu đó để hoàn thành quy trình làm việc rộng hơn của mình và viết email. Vậy sự khác biệt giữa hai loại này là gì? Đó là tác nhân AI hành động, trong khi tác nhân dữ liệu làm nền tảng. Cảm ơn bạn đã đọc. Nếu bạn thấy

Nguồn tin: Towards Data Science — Tác giả: Marina Tosic. Bản dịch tiếng Việt do AI thực hiện, có thể có sai sót.