Tác nhân học tăng cường – hệ thống AI học bằng cách thử và sai – có thể chuyển đổi tính toán thành kiến thức mới.
Đó là trọng tâm của sự hợp tác cấp độ kỹ thuật mới giữa NVIDIA và Ineffable Intelligence, phòng thí nghiệm AI có trụ sở tại London do kiến trúc sư David Silver của AlphaGo thành lập sau khi Ineffable xuất hiện từ trạng thái tàng hình vào tuần trước.
Jensen Huang, người sáng lập và CEO của NVIDIA cho biết: “Biên giới tiếp theo của AI là những người siêu học – những hệ thống học hỏi liên tục từ kinh nghiệm”. “Chúng tôi rất vui mừng được hợp tác với Ineffable Intelligence để thiết kế cơ sở hạ tầng cho việc tăng cường quy mô lớn.
Tác nhân học tăng cường – hệ thống AI học bằng cách thử và sai – có thể chuyển đổi tính toán thành kiến thức mới.
Đó là trọng tâm của sự hợp tác cấp độ kỹ thuật mới giữa NVIDIA và Ineffable Intelligence, phòng thí nghiệm AI có trụ sở tại London do kiến trúc sư David Silver của AlphaGo thành lập sau khi Ineffable xuất hiện từ trạng thái tàng hình vào tuần trước.
Jensen Huang, người sáng lập và CEO của NVIDIA cho biết: “Biên giới tiếp theo của AI là những người siêu học – những hệ thống học hỏi liên tục từ kinh nghiệm”. “Chúng tôi rất vui mừng được hợp tác với Ineffable Intelligence để thiết kế cơ sở hạ tầng cho việc học tăng cường quy mô lớn khi họ vượt qua giới hạn của AI và đi tiên phong trong thế hệ hệ thống thông minh mới.”
Silver là một trong những người tiên phong trong lĩnh vực học tăng cường, một phương pháp tiếp cận đã làm thay đổi hoạt động nghiên cứu AI. Anh ấy tập trung vào việc phát triển hơn nữa cách tiếp cận này thành một mô hình mới.
Silver cho biết: “Các nhà nghiên cứu phần lớn đã giải quyết được vấn đề dễ dàng hơn của AI: làm thế nào để xây dựng các hệ thống biết tất cả những điều con người đã biết”. "Nhưng bây giờ chúng ta cần giải quyết vấn đề khó khăn hơn của AI: làm thế nào để xây dựng các hệ thống có thể tự khám phá kiến thức mới. Điều đó đòi hỏi một cách tiếp cận rất khác - các hệ thống học hỏi từ kinh nghiệm."
Kiểu học tập đó cần một hệ thống mạnh mẽ và được tối ưu hóa cao để hỗ trợ nó. Không giống như đào tạo trước, trong đó một tập dữ liệu cố định gồm dữ liệu con người truyền qua hệ thống, khối lượng công việc học tăng cường sẽ tạo ra dữ liệu của họ một cách nhanh chóng.
Hệ thống phải hành động, quan sát, ghi điểm và cập nhật liên tục trong các vòng lặp chặt chẽ, điều này gây áp lực lên kết nối, băng thông bộ nhớ và phân phát theo những cách mà việc đào tạo trước không làm được. Hơn nữa, hệ thống sẽ đào tạo dựa trên các dạng trải nghiệm phong phú, khá khác biệt với ngôn ngữ của con người và các dữ liệu khác của con người, đồng thời có thể yêu cầu các kiến trúc mô hình và thuật toán đào tạo mới.
Đó là nơi NVIDIA và Ineffable đang tập trung vào công việc kỹ thuật của họ: xây dựng một quy trình có thể cung cấp các hệ thống học tăng cường trên quy mô lớn. Các kỹ sư của cả hai công ty đã hợp tác để khám phá cách tốt nhất để tạo ra quy trình đào tạo này.
Công việc này đang bắt đầu trên NVIDIA Grace Blackwell và sẽ là một trong những công việc đầu tiên khám phá nền tảng NVIDIA Vera Rubin sắp tới. Mục tiêu là để hiểu thế hệ phần cứng và phần mềm tiếp theo sẽ được yêu cầu khi thế giới AI chuyển đổi ngoài dữ liệu của con người sang các mô hình học thông qua mô phỏng và trải nghiệm.
Việc sử dụng đúng cơ sở hạ tầng này sẽ mở ra quy mô học tăng cường chưa từng có trong môi trường rất phức tạp và phong phú, cho phép các tác nhân khám phá những đột phá trên tất cả các lĩnh vực kiến thức.
Nguồn tin: NVIDIA AI Blog — Tác giả: NVIDIA Writers. Bản dịch tiếng Việt do AI thực hiện, có thể có sai sót.