Lưu trữ Bảng điều khiển do LLM tạo: Kiến trúc Snowflake được…

Hội nghị Snowflake Summit diễn ra từ ngày 1 đến ngày 4/6/2026, với một chủ đề xuyên suốt bài phát biểu chính: doanh nghiệp tự chủ (agentic enterprise) và bối cảnh được quản trị (governed context) giúp vận hành an toàn. Snowflake Intelligence được đổi tên thành CoWork, Horizon Context được triển khai dưới dạng một lớp quản trị cho AI, BI và các ứng dụng. Ý tưởng cơ bản là một lớp ngữ nghĩa được quản trị (governed semantic layer) chính là từ vựng mà một tác nhân (agent) đọc. Bài viết này cũng đề cập đến ý tưởng tương tự từ góc độ bảng điều khiển (dashboard): làm thế nào để một LLM có thể xây dựng bảng điều khiển trong vài phút mà vẫn đảm bảo RBAC (kiểm soát truy cập dựa trên vai trò), lớp ngữ nghĩa, hợp đồng làm mới (refresh contract) và nhật ký kiểm toán (audit trail)? Mã nguồn mở mà bạn có thể phân nhánh (fork) cho kho dữ liệu của riêng mình, không chỉ c

Snowflake Summit diễn ra từ ngày 1 đến 4/6/2026, và một chủ đề xuyên suốt bài phát biểu chính là doanh nghiệp tác nhân (agentic enterprise) cùng với bối cảnh được quản trị (governed context) giúp vận hành an toàn. Snowflake Intelligence được đổi tên thành CoWork, Horizon Context được triển khai như một lớp quản trị cho AI, BI và các ứng dụng, với ý tưởng cơ bản là một lớp ngữ nghĩa được quản trị (governed semantic layer) chính là từ vựng mà một tác nhân (agent) đọc. Bài viết này cũng đề cập đến ý tưởng tương tự từ góc độ bảng điều khiển (dashboard): làm thế nào để cho phép một mô hình ngôn ngữ lớn (LLM) xây dựng bảng điều khiển trong vài phút mà vẫn đảm bảo kiểm soát truy cập dựa trên vai trò (RBAC), một lớp ngữ nghĩa, hợp đồng làm mới (refresh contract) và nhật ký kiểm toán (audit trail)? Mã nguồn mở có thể phân nhánh (fork) cho kho dữ liệu của riêng bạn, không chỉ là bình luận. Hãy tưởng tượng một Phó Chủ tịch phụ trách vận hành doanh thu (revenue-ops VP) cho bạn xem một bảng điều khiển HTML do AI xây dựng, mà họ đã có thể chia sẻ bằng liên kết, và hỏi tại sao bạn không triển khai nó. Câu trả lời không phải là không. Lumen AI là một công ty hư cấu. Mọi thứ trong bản demo đều là dữ liệu tổng hợp được tạo bởi scripts/setup_demo.sql trên bản dùng thử Snowflake. Cuộc trò chuyện đã bắt đầu điều này. Hãy hình dung một Phó Chủ tịch phụ trách vận hành doanh thu: có kiến thức kỹ thuật ở mức độ trung bình, quen thuộc với các báo cáo Salesforce, đôi khi viết công thức trong Looker. Họ đã làm việc trong một công cụ trò chuyện AI với một trình kết nối trực tiếp đến một hệ thống nguồn như Salesforce (một máy chủ MCP) được bật, và trong năm phút họ đã tạo ra một bảng điều khiển tình trạng đường ống (pipeline-health dashboard) HTML sạch sẽ. Tám chỉ số hiệu suất chính (KPI) ở trên cùng. Một biểu đồ cột dự báo so với doanh thu đã chốt. Một bảng các giao dịch bị đẩy lùi. Các con số khớp với những gì họ mong đợi. Chất lượng hình ảnh thực sự tốt, tốt hơn hai trong ba bảng Looker mà nhóm của họ hiện đang sử dụng. Và công cụ đó hiện cung cấp cho họ một liên kết chia sẻ. “Tại sao tôi phải chờ sáu tuần để nhóm BI xây dựng cái này trong khi tôi có thể có nó trong năm phút ở đây? Tôi đã có liên kết rồi, chúng ta có thể gửi nó cho ban lãnh đạo không?” Mẫu hình này đang xuất hiện trong các nhóm dữ liệu. Câu trả lời tồi tệ nhất có thể là “không, đó không phải là cách chúng tôi làm BI.” Câu trả lời đúng sẽ chia câu hỏi thành bốn mối quan tâm độc lập: Dữ liệu đến từ đâu? LLM đã tự viết SQL dựa trên một trình kết nối trực tiếp, không có lớp ngữ nghĩa và không có định nghĩa chỉ số được xác thực. Con số hôm nay khớp với kiểm tra trực quan; con số ngày mai sẽ không khớp với bảng điều khiển BI vì các định nghĩa khác nhau. Ai được phép xem nó? “Chia sẻ liên kết” không phải là kiểm soát truy cập. Trỏ một MCP hệ thống nguồn vào kho dữ liệu thông qua một vai trò chỉ đọc được chia sẻ (thiết lập phổ biến) và liên kết hoạt động cho bất kỳ ai giữ nó, không có cách nào để chặn một người dùng duy nhất hoặc che giấu một cột cho một số người xem nhưng không phải những người khác, bởi vì các chính sách không thể phân biệt hai người giữ cùng một vai trò. Điều gì xảy ra khi dữ liệu thay đổi? Một tệp HTML tĩnh với một khối JSON được mã hóa cứng là một ảnh chụp nhanh, không phải là một bảng điều khiển. Ngay cả một tạo phẩm trực tiếp cũng không cung cấp cho bạn hợp đồng về thời điểm, hoặc liệu, nó có làm mới hay không. Và nếu mỗi người xem truy vấn lại nguồn, giới hạn tốc độ có thể khiến việc làm mới thất bại. Điều gì xảy ra khi bảng điều khiển thay đổi? Chỉnh sửa nó, mất phiên bản trước. Không có sự khác biệt (diff), không có yêu cầu kéo (PR), không có đánh giá, không có cách nào để cho một bên liên quan biết họ đã xem phiên bản nào. “Vậy thì hãy kết nối thông qua MCP của Snowflake, đằng sau một chế độ xem ngữ nghĩa,” bạn có thể trả lời, và điều đó giải quyết hai vấn đề đầu tiên. Các chỉ số được định nghĩa một lần và khớp với bảng điều khiển BI. Và kể từ khi máy chủ MCP được quản lý được phát hành rộng rãi (GA) vào tháng 11/2025, mỗi người xác thực bằng danh tính của riêng họ và chạy dưới vai trò của riêng họ, vì vậy các chính sách truy cập hàng (row-access) và che giấu (masking) cuối cùng cũng phân biệt được người dùng. Hai mối quan tâm đã được giải quyết. Hai mối quan tâm còn lại không thay đổi. Mỗi câu hỏi tự do là một chế độ xem ad-hoc mới: không có bản ghi về câu trả lời mà một bên liên quan thực sự đã xem, không có lịch sử phiên bản, không có cổng đánh giá quyết định báo cáo nào. được phép lưu hành. Một phản hồi trò chuyện hoặc một đoạn trích xuất vẫn chỉ là một ảnh chụp nhanh: nó sẽ lỗi thời trong khi các ô xung quanh được làm mới. Có ba cách để đưa một con số ra trước một bên liên quan, và chỉ có một cách đáp ứng được cả bốn tiêu chí: Những cách tiếp cận này không phải là lập luận chống lại HTML do LLM tạo ra. Việc trực quan hóa là tốt. Đây là những lập luận ủng hộ việc tách biệt quá trình tạo (mà LLM làm tốt) khỏi quá trình lưu trữ (mà LLM không làm được chút nào). Sự tách biệt đó là yếu tố thúc đẩy thiết kế cho mọi thứ sau đây. Bài giới thiệu trong 90 giây Ba nhận định: LLM rất giỏi trong việc tạo ra các bảng điều khiển HTML một lần, thường tốt hơn trong năm phút so với hầu hết chúng ta có thể tự xây dựng. Các tạo phẩm được tạo ra bên ngoài công cụ BI không có các móc quản trị: không có RBAC, không có lịch sử phiên bản, không có nhật ký kiểm tra, không có làm mới theo lịch trình, không có thanh bên trò chuyện. Chúng là các tệp. Bạn có thể gói chúng trong một vỏ Streamlit-in-Snowflake mỏng (một lõi hiển thị nhỏ, với thanh bên trò chuyện Cortex Analyst ở trên) và kế thừa quản trị kho dữ liệu của bạn miễn phí. Vỏ bọc này khám phá từng bảng điều khiển từ một thư mục chứa ba tệp: apps/ pipeline_health/ manifest.yml # tiêu đề, cột, vai trò được phép, số lượng chip query.sql # dữ liệu mà trang hiển thị page.html # HTML/CSS/JS độc lập, với mã thông báo __DATA__ semantic_view.sql # tùy chọn: hỗ trợ thanh bên trò chuyện Việc tạo có thể thay thế được. Hôm nay tạo phẩm đến từ Claude. Ngày mai nó có thể đến từ v0, tác nhân mã hóa CoCo của Snowflake, một bản xuất sổ ghi chép, một trang viết tay. Vỏ lưu trữ không quan tâm. Hợp đồng là ba tệp. diagram_authoring_vs_hosting Trình chạy đọc manifest, chạy SQL, thay thế kết quả JSON vào __DATA__, và hiển thị HTML bên trong một iframe. Các bên liên quan thấy một bảng điều khiển chạy trên dữ liệu trực tiếp, tôn trọng vai trò của họ, ghi lại mọi lượt trò chuyện và thay đổi thông qua PR. Những gì một kiến trúc sư dữ liệu sẽ phản đối Các đường ống kết nối trực tiếp → LLM → HTML có các chế độ lỗi có thể dự đoán được: Các định nghĩa số liệu trôi dạt khỏi nguồn sự thật. LLM chọn các trường bằng cách khớp tên. Amount so với net_new_arr_usd: cùng một bảng, độ chính xác khác nhau, ý nghĩa kinh doanh khác nhau. Không có nhận thức về SCD (Slowly Changing Dimension). Một trình kết nối trực tiếp kéo trạng thái hiện tại. Trượt dự báo, pipeline-as-of, tỷ lệ thắng theo nhóm đều cần lịch sử tại một thời điểm mà các trình kết nối hoạt động không hiển thị. Tính cardinality và độ tươi mới là im lặng. LLM sẽ vui vẻ tổng hợp một bảng triệu hàng vào một biểu đồ trong trình duyệt. Trình kết nối đặt ranh giới bảo mật, không phải kho dữ liệu. Một MCP (Master Control Program) của hệ thống nguồn chạy trên hệ thống mà nó

Lưu trữ Bảng điều khiển do LLM tạo: Kiến trúc Snowflake được quản lý