NVIDIA hợp tác với Microsoft phát triển bộ công cụ thống nhất…

Thời điểm của AI tác nhân (agentic AI) đã đến, nhưng để hiện thực hóa tiềm năng của nó đòi hỏi nhiều hơn là những mô hình tốt. Nó còn cần phần cứng nhanh, môi trường chạy an toàn, lớp dữ liệu phản hồi nhanh và các mô hình được tinh chỉnh cho quá trình suy luận kéo dài. NVIDIA và Microsoft đang mang toàn bộ hệ thống này đến các nhà phát triển trên thiết bị Windows, đám mây Azure và các triển khai cục bộ. Tại sự kiện Microsoft Build, người sáng lập và Giám đốc điều hành (CEO) của NVIDIA, ông Jensen Huang, đã tham gia bài phát biểu chính của Chủ tịch và CEO Microsoft, ông Satya Nadella, thông qua livestream từ Đài Bắc để thảo luận về quan hệ đối tác mở rộng: NVIDIA RTX Spark và DGX Station cho Windows, Microsoft F được tăng tốc bằng GPU NVIDIA.

Thời điểm của AI tác nhân (agentic AI) đã đến, nhưng để hiện thực hóa lời hứa của nó đòi hỏi nhiều hơn là những mô hình tốt. Nó còn cần phần cứng nhanh, môi trường chạy an toàn (secure runtimes), lớp dữ liệu phản hồi nhanh và các mô hình được tinh chỉnh cho suy luận dài hạn. NVIDIA và Microsoft đang mang toàn bộ ngăn xếp (full stack) này đến các nhà phát triển trên các thiết bị Windows, đám mây Azure và các triển khai cục bộ. Tại sự kiện Microsoft Build, người sáng lập và CEO của NVIDIA, Jensen Huang, đã tham gia bài phát biểu chính của Chủ tịch và CEO Microsoft, Satya Nadella, qua livestream từ Đài Bắc để thảo luận về quan hệ đối tác mở rộng: NVIDIA RTX Spark và DGX Station cho Windows, Microsoft Fabric được tăng tốc bằng GPU NVIDIA, các mô hình mở của NVIDIA trên Microsoft Foundry, môi trường chạy an toàn NVIDIA OpenShell trong GitHub Copilot và thế hệ nhà máy AI tiếp theo được cung cấp bởi NVIDIA. Tái tạo Windows cho các tác nhân: Từ RTX Spark đến DGX Station cho Windows NVIDIA và Microsoft đang tái hình dung PC Windows cho kỷ nguyên của các tác nhân AI. Với máy tính xách tay và máy tính để bàn nhỏ RTX Spark, cùng với siêu máy tính AI để bàn DGX Station cho Windows, các nhà phát triển có thể xây dựng, tinh chỉnh và chạy các tác nhân một cách nguyên bản trên Windows. RTX Spark là một khởi đầu mới, cung cấp sức mạnh cho những chiếc PC Windows đầu tiên trên thế giới được chế tạo đặc biệt cho các tác nhân cá nhân, với hiệu suất AI 1 petaflop, bộ nhớ hợp nhất lên đến 128GB, thời lượng pin cả ngày và hiệu suất AI và đồ họa đầy đủ khi không cắm điện. Mang đến hơn 30 năm đổi mới của NVIDIA, bao gồm CUDA, RTX, DLSS và TensorRT, các hệ thống này sẽ ra mắt vào mùa thu năm nay từ Microsoft Surface, ASUS, Dell, HP, Lenovo và MSI. DGX Station cho Windows là siêu máy tính AI để bàn mạnh mẽ nhất để xây dựng và chạy các tác nhân trên các ứng dụng và quy trình làm việc doanh nghiệp của Windows. Được trang bị siêu chip để bàn NVIDIA GB300 Grace Blackwell Ultra với bộ nhớ đồng nhất lên đến 748GB và hiệu suất FP4 20 petaflop, nó chạy các mô hình tiên tiến lên đến 1 nghìn tỷ tham số cho các tác nhân doanh nghiệp luôn hoạt động. Các hệ thống dự kiến sẽ có mặt từ ASUS, Dell, GIGABYTE, HP, MSI và Supermicro vào quý 4. Cả hai sản phẩm đều chạy NVIDIA OpenShell, một môi trường chạy được thiết kế an toàn cho các tác nhân tự động. Đọc thêm trong blog của Microsoft: “Giới thiệu một chương mới mạnh mẽ cho PC Windows, được tăng tốc bởi NVIDIA RTX Spark” Cung cấp sức mạnh cho các quy trình làm việc tác nhân ở quy mô doanh nghiệp với các mô hình mở của NVIDIA trên Microsoft Foundry AI tác nhân chạy trên một hệ thống các mô hình. Với các mô hình của NVIDIA, Anthropic và OpenAI — cùng với các tác nhân đặc biệt của Hermes — hiện có trên các tác nhân được lưu trữ trong Foundry Agent Service, các doanh nghiệp có thể đưa các hệ thống tác nhân vào hoạt động trên Azure với khả năng nhận dạng và quản trị tích hợp. Các mô hình Claude của Anthropic hiện chạy nguyên bản trên các hệ thống NVIDIA GB300 Blackwell Ultra trên Azure, với khả năng cung cấp cho khách hàng trong những tuần tới. NVIDIA Nemotron 3 Ultra, một mô hình suy luận tiên tiến mở mới cho các tác nhân chạy dài hạn trên các quy trình mã hóa, nghiên cứu và doanh nghiệp, sẽ có mặt trong tháng này trên nền tảng điện toán được quản lý của Foundry, cùng với Nemotron 3.5 ASR cho nhận dạng giọng nói và Nemotron 3.5 Content Safety. Các nhà phát triển có thể kết hợp Nemotron với các mô hình tiên tiến và cục bộ, tối ưu hóa chi phí và chất lượng cho từng quy trình làm việc. Danh mục mô hình mở của NVIDIA trên Foundry hiện bao gồm AI tác nhân, vật lý và khoa học. NVIDIA Cosmos 3, omnimodel mở hoàn toàn đầu tiên cho AI vật lý, mang đến khả năng suy luận thị giác, mô phỏng thế giới và tạo hành động. Các mô hình thời tiết NVIDIA Earth-2 AI có sẵn thông qua Microsoft Planetary Computer Pro và Foundry để dự báo và phân tích rủi ro cho doanh nghiệp. NVIDIA Agent Toolkit và các bản thiết kế NVIDIA NemoClaw cung cấp cho nhà phát triển một nền tảng mã nguồn mở để xây dựng các tác nhân sản xuất trên Foundry. Các thư viện NVIDIA CUDA-X bao gồm cuDF, cuOpt, AI-Q và NeMo hiện có thể truy cập được đối với các tác nhân dưới dạng kỹ năng chuyên biệt theo từng lĩnh vực. Tìm hiểu thêm trong phiên thảo luận chuyên sâu Build này: “Điều phối các tác nhân đặc biệt với các mô hình NVIDIA Nemotron trên Microsoft Foundry.” Tăng tốc kho dữ liệu doanh nghiệp cho kỷ nguyên AI Dữ liệu là nhiên liệu cho AI tác nhân, và việc truy cập nhanh chóng vào dữ liệu là rất quan trọng. Công nghệ điện toán tăng tốc của NVIDIA hiện đã được tích hợp vào Microsoft Fabric Data Warehouse, với kết quả đánh giá nội bộ của Microsoft cho thấy hiệu suất thực thi SQL nhanh hơn tới 6 lần so với nền tảng CPU và nhanh hơn tới 7 lần so với ba nhà cung cấp kho dữ liệu đám mây hàng đầu khác đối với các tác vụ có độ đồng thời cao. Lớp dữ liệu doanh nghiệp giờ đây có thể theo kịp các tác nhân AI liên tục truy vấn và suy luận trên dữ liệu, đây là kết quả của nhiều năm hợp tác kỹ thuật sâu rộng giữa NVIDIA và Microsoft, từ nghiên cứu đến sản xuất. Đọc thêm trong blog của Microsoft: “Microsoft Build 2026: Xây dựng ứng dụng tác nhân với Microsoft Fabric và Microsoft Databases” Thúc đẩy AI vật lý và hệ thống tự hành AI vật lý là biên giới tiếp theo cho các tác nhân. Microsoft đang tích hợp các công cụ và kỹ năng AI vật lý mã nguồn mở của NVIDIA với Azure và Bộ công cụ AI vật lý của mình. Các nhà phát triển có được một nền tảng thống nhất, được hỗ trợ bởi kiến trúc mixture-of-transformers của Cosmos 3, để mô phỏng, đào tạo và triển khai các hệ thống tự hành, bao gồm robot, phương tiện tự hành và hệ thống công nghiệp có thể nhận thức, suy luận, lập kế hoạch và hành động trong thế giới vật lý. Cosmos 3 xếp hạng đầu tiên trong số các mô hình mở về các tiêu chuẩn chính cho suy luận thị giác, tạo thế giới và tạo hành động. Nâng cao Azure Local và Foundry Local với NVIDIA RTX PRO 6000 Blackwell Server Edition và các mô hình Nemotron AI tác nhân đang vượt ra ngoài đám mây. Microsoft đang đưa Foundry Local trên Azure Local lên nền tảng NVIDIA RTX PRO 6000 Blackwell Server Edition. Kết hợp với dòng mô hình mở NVIDIA Nemotron, các doanh nghiệp có thể chạy các khối lượng công việc AI hiệu suất cao tại nơi dữ liệu của họ cư trú, dù là trong môi trường tại chỗ, lai hoặc có chủ quyền, mà không phải hy sinh hiệu suất hoặc quản trị. Foundry Local trên Azure Local hiện hỗ trợ triển khai đa nút và thời gian chạy vLLM, mở rộng quy mô suy luận cho sản xuất, năng lượng, trung tâm dữ liệu có chủ quyền và các kịch bản nhạy cảm với độ trễ khác. Tìm hiểu thêm trong các blog của Microsoft: “Mở khóa các khả năng của AI vật lý với Foundry Local và Azure Local” | “Mở rộng quy mô AI tại chỗ với Foundry Local trên Azure Local” Mang lại tính bảo mật

NVIDIA hợp tác với Microsoft phát triển bộ công cụ thống nhất để triển khai AI tác nhân, từ thiết bị Windows đến đám mây và cục bộ.