Thoát khỏi “Thung lũng lựa chọn” trong BI

Vì sao BI dạng tác nhân (Agentic BI) đe dọa cả một ngành nghề Bài viết Thoát khỏi thung lũng lựa chọn trong BI xuất hiện lần đầu trên Towards Data Science.

Khoa học dữ liệu Thoát khỏi Thung lũng Lựa chọn trong BI Tại sao BI tác nhân đe dọa toàn bộ một ngành nghề Hugo Lu Ngày 1/6/2026 9 phút đọc Chia sẻ Ảnh của Tomoe Steineck trên Unsplash Giới thiệu Các bảng điều khiển (dashboard) chưa bao giờ bị loại bỏ vì chúng hoạt động trong Thung lũng Lựa chọn trong BI. Thung lũng Lựa chọn mô tả tỷ lệ hoàn hảo giữa độ phức tạp của một vấn đề và nỗ lực chúng ta sẵn sàng bỏ ra để giải quyết nó. Ví dụ, một câu hỏi quan trọng đối với doanh nghiệp về cách doanh thu được hình thành và tại sao các phiên bản doanh thu khác nhau thay đổi theo thời gian có thể cần đến việc khám phá thủ công. Nó có thể cần đến việc khám phá sâu sắc được hỗ trợ bởi nhiều truy vấn SQL và ghi lại kết quả cũng như theo dõi nguồn gốc một cách thủ công. Đây là phương pháp Nỗ lực cao, Độ chính xác cao. Ngược lại, các câu hỏi đơn giản trên các tập dữ liệu đơn giản như “Tôi đã có bao nhiêu lượt đăng ký ngày hôm qua?” có thể được giải quyết bằng các phương pháp đơn giản hơn, ít tốn công hơn như Text to SQL cơ bản, như đã thấy trong các công cụ như Thoughtspot. Ở giữa là các bảng điều khiển. Các bảng điều khiển cung cấp một giải pháp nỗ lực vừa phải cho một vấn đề phức tạp vừa phải. Chúng có khả năng trả lời nhiều câu hỏi và xoay vòng dữ liệu để giải thích các bất thường và dự báo xu hướng. Chúng không giúp khám phá thông tin chi tiết, mà giúp bạn cung cấp các thông tin chi tiết bạn đã tìm thấy. Khi một điều gì đó được hỏi đủ thường xuyên, nó trở nên xứng đáng để có một bảng điều khiển, và ngay lập tức chuyển từ một thông tin chi tiết khó khăn, một lần, được cung cấp thủ công thành một thứ đơn giản hơn và có thể lặp lại hơn. Agentic Analytics (Phân tích tác nhân) cung cấp một cách mới để khám phá và cung cấp thông tin chi tiết. Đó là Text-to-SQL. Cách mới này có nghĩa là các truy vấn phức tạp vừa phải trước đây giờ đây có thể được trả lời ngay lập tức. Các công cụ như Hex tích hợp bộ nhớ vào nền tảng của họ, điều này có nghĩa là ngay cả các truy vấn phức tạp, khi kết hợp với bộ nhớ, cho phép Text-to-SQL giải quyết các vấn đề phức tạp. Điều này thay đổi tỷ lệ nỗ lực cần thiết so với độ phức tạp và sẽ định hình lại cách chúng ta nghĩ về phân tích. Hãy cùng xem xét. Giải thích Thung lũng Lựa chọn trong BI Thung lũng Lựa chọn có thể được hình dung dưới đây. Thung lũng Lựa chọn trong BI. Hình ảnh của tác giả Nó mô tả sự đánh đổi giữa tốc độ và độ chính xác được xác định bởi bản chất của nhu cầu hoặc thông tin chi tiết. Giữ mọi thứ không đổi, các câu hỏi quan trọng nhất đòi hỏi mức độ chính xác cao nhất, điều này đến lượt nó biện minh cho các phương pháp tốn thời gian hơn (Nỗ lực cao). Nó giống như việc bạn có thể mua một chiếc bánh sandwich ngon từ cửa hàng đồ ăn nhanh với giá 20 USD hoặc đến 11 Madison Park với giá 500 USD. Hai sản phẩm khác nhau, hai lựa chọn khác nhau, hai mức giá khác nhau. Các bảng điều khiển giống như một bữa ăn tại một nhà hàng bình thường. 100 USD mỗi người, nhưng không phù hợp nếu bạn là một người đàn ông độc thân đủ tiêu chuẩn ở New York. Bây giờ: Hãy tưởng tượng có một nhà hàng mới. Nhà hàng mới này rất độc quyền. Đồ ăn tuyệt vời; mọi thứ đều hữu cơ. Dịch vụ xuất sắc. Và rất nhiều người nổi tiếng đến đó. Nó rất đáng mơ ước. Bạn có thể có một bữa ăn 3 món ngon tuyệt với giá 40 USD. Chúng ta có thể gọi nó là Hugo’s Diner. Trên thực tế, đó là một phần của xu hướng mới. Hugo có một đế chế nhà hàng rộng lớn. Có Hugo’s Diner, nhưng cũng có Casa Hugo, Chez Hugo, Hugo’s table và thậm chí cả Hugo-San. Hugo-San cung cấp món omakase ngon nhất thành phố với giá 39,50 USD. Đây có thể là bạn. Được tạo bằng Gemini Bạn làm gì? Bạn dùng bữa ở đâu? 11 Madison Park đột nhiên không còn bận rộn nữa. Và đây là những gì đang xảy ra với BI. Nói một cách đơn giản, chi phí và tốc độ chạy truy vấn thông qua các công cụ chuyển văn bản thành SQL (text-to-SQL) thế hệ mới là cực kỳ thấp. Điều này có nghĩa là về cơ bản không có lý do gì để thực hiện bất kỳ phương pháp nào khác, trừ khi thực sự bắt buộc. Trong mọi trường hợp, chắc chắn không có sự dịch chuyển xuống phân khúc thấp hơn. Đúng vậy – đôi khi có thể cần thực hiện thủ công một số việc. Chỉ để đảm bảo. Và tương tự, không có gì sánh bằng Dorsia trong một buổi hẹn hò (dữ liệu?). Thung lũng dịch chuyển: Tiêu chuẩn cho phân tích vừa được nâng cao Hãy hình dung rằng không cần phải nỗ lực để xây dựng lớp ngữ nghĩa và Text to SQL có thể giải quyết một cách đáng tin cậy, lặp lại, 95% các câu hỏi. Một nhà phân tích gần như trở thành một siêu nhà phân tích. Họ sẽ chỉ được hỏi những câu hỏi thực sự phức tạp. Họ có lẽ là người đã thiết kế lớp ngữ nghĩa ngay từ đầu. Thung lũng lựa chọn mới trong BI. Ảnh của tác giả. Giá của sự chính xác đã trở nên cao hơn nhiều. Để thực hiện thủ công một việc gì đó, bạn phải đặt một câu hỏi cực kỳ quan trọng. Điều này có ý nghĩa gì đối với các nhà phân tích? Vâng, cũng tương tự như đối với các kỹ sư phần mềm. Giờ đây, tỷ lệ những người thực sự hữu ích đã giảm đi rất nhiều – tất nhiên, theo một cách công bằng. Một nhà phân tích không thể trở thành kiến trúc sư ngữ nghĩa sẽ trở nên vô dụng trong 12 tháng. Họ sẽ được thay thế bởi các tác nhân thông tin (insights agents). Và nếu họ vẫn cố chấp, thì các CTO đang làm điều gì đó sai và có lẽ nên mời các đối tác dịch vụ để giúp họ triển khai lớp ngữ nghĩa của mình. Tiêu chuẩn để làm việc trong lĩnh vực phân tích vừa được nâng cao. Có một đối thủ cạnh tranh mới xuất hiện và tên của họ là A. Gent. Giống như kỹ thuật phần mềm – các kỹ sư cấp dưới (juniors) bị loại bỏ, và các kỹ sư cấp cao (seniors) được trọng dụng. Còn chi phí token thì sao? Chi phí token là một điểm thú vị. Chi phí token nói chung đã giảm 95% kể từ các mô hình đầu tiên. Chi phí suy luận tiếp tục giảm, và dự kiến sẽ giảm thêm 95% trong vài năm tới. Nguồn: Epoch AI (CC-BY) Mặc dù vậy, các công ty như Uber vẫn đang tiêu tốn rất nhiều tín dụng. Rốt cuộc, tín dụng rất thú vị. Claude gây nghiện. Việc tối đa hóa token (Tokenmaxxing) được khuyến khích. Thực tế, giá của các mô hình tiên tiến chưa giảm đáng kể. Chi phí của Claude vào năm 2023 là khoảng 32 USD/triệu token đầu ra. Hiện tại vẫn là 25 USD. Trên thực tế, việc sử dụng token dự kiến sẽ tăng theo cấp số nhân khi các hệ thống trở nên phức tạp hơn – không rõ khi nào, nếu có, lợi ích sẽ xuất hiện. Ví dụ, 1 triệu token đầu ra cho Claude có giá khoảng 25 USD. Giả sử chạy một vài truy vấn thông qua một tác nhân là 1.000 token. Điều này có nghĩa là chi phí của một truy vấn là 0,025 của 2,5 cent. 10.000 người thực hiện một truy vấn mỗi ngày trong 365 ngày một năm là 91.000 USD. Không tệ. Nếu chi phí