Khi một nhóm các nhà khoa học bắt đầu chế tạo phần cứng robot mã nguồn mở, một thế hệ các nhà nghiên cứu robot đã tiết kiệm được nhiều năm làm việc. Hiện nay, thách thức lớn hơn là làm cho robot có khả năng tư duy – và điều này cũng đang bắt đầu được phát triển theo hướng mã nguồn mở.
Sự thay đổi này vẫn còn ở giai đoạn đầu, nhưng các công ty như Hugging Face, Nvidia và Alibaba đều đã đầu tư đáng kể vào robot mã nguồn mở trong hai năm qua, phát hành các công cụ và mô hình nhằm giải quyết các công việc cấp cao hơn, giúp robot lập luận, đưa ra quyết định và hành động.
Phong trào mã nguồn mở đã thúc đẩy các ứng dụng AI khác hiện đang được áp dụng để giải quyết vấn đề chế tạo robot.
Khi một nhóm các nhà khoa học bắt đầu chế tạo phần cứng robot mã nguồn mở, một thế hệ các nhà nghiên cứu robot đã tiết kiệm được nhiều năm làm việc. Hiện nay, thách thức lớn hơn là làm cho robot có khả năng tư duy – và điều này cũng đang bắt đầu được phát triển theo hướng mã nguồn mở.
Sự thay đổi này vẫn còn ở giai đoạn đầu, nhưng các công ty như Hugging Face, Nvidia và Alibaba đều đã đầu tư đáng kể vào robot mã nguồn mở trong hai năm qua, phát hành các công cụ và mô hình nhằm giải quyết các công việc cấp cao hơn, giúp robot lập luận, đưa ra quyết định và hành động.
Phong trào mã nguồn mở đã thúc đẩy các ứng dụng AI khác, nay đang được áp dụng để giải quyết vấn đề làm cho robot thông minh hơn. Nếu những nỗ lực đưa AI vào robot bằng các nền tảng mã nguồn mở này thành công, rào cản để chế tạo một robot có khả năng có thể giảm nhanh chóng, tương tự như cách rào cản để xây dựng một ứng dụng AI đã giảm.
Thế giới mà ROS đã xây dựng
Phần mềm robot mã nguồn mở đã xuất hiện từ giữa những năm 1990, với các dự án ban đầu như gói Inter-Process Communication của Đại học Carnegie Mellon và Player Project vào đầu những năm 2000 đã đặt nền móng. Tuy nhiên, những dự án này thường gắn liền với các nhóm nghiên cứu cụ thể, và lĩnh vực này vẫn còn phân mảnh.
Hệ điều hành Robot (Robot Operating System - ROS) đã thay đổi điều đó khi ra mắt vào năm 2007. Bằng cách tích hợp các công cụ và thu hút nhiều người dùng hơn, ROS đã trở thành tiêu chuẩn thực tế. Câu chuyện về robot mã nguồn mở, theo nhiều cách, bắt đầu từ đó.
Mặc dù có tên gọi như vậy, ROS thực chất không phải là một hệ điều hành. Thay vào đó, nó là một khung phần mềm chạy trên nền Linux và xử lý các chức năng cơ bản của robot như di chuyển dữ liệu giữa các thành phần, giao tiếp với phần cứng, xây dựng bản đồ, lập kế hoạch đường đi và hỗ trợ các công cụ phát triển, chẳng hạn như ghi nhật ký dữ liệu và trực quan hóa. Trước ROS, mỗi nhóm robot đều phải tự viết cơ sở hạ tầng đó. Thường mất một hoặc hai năm trước khi một phòng thí nghiệm có thể bắt đầu nghiên cứu mà họ thực sự quan tâm.
Ông Brian Gerkey, người đã giúp xây dựng ROS vào giữa những năm 2000, cho biết ông bị thu hút bởi dự án này vì mức độ mà mã nguồn mở đã thay đổi thế giới, chỉ ra rằng gần như toàn bộ internet được xây dựng trên đó.
Ông Gerkey, Chủ tịch Hội đồng quản trị của Open Robotics và hiện là CTO tại Intrinsic, một đơn vị robot và AI của Google, cho biết: "Tôi là một nhà phát triển công cụ, và tôi muốn chia sẻ mọi thứ một cách cởi mở nhất có thể, bởi vì tôi nghĩ đó là nơi chúng ta đạt được tác động lớn nhất từ những gì chúng ta xây dựng".
Trong quá trình phát triển, cộng đồng AI phần lớn đã áp dụng cùng một cách tiếp cận, chia sẻ nghiên cứu, mô hình và dữ liệu một cách công khai, và lĩnh vực này đã tăng tốc nhanh hơn hầu hết mọi người dự đoán. Giờ đây, một số tiến bộ tương tự đang đến với lĩnh vực robot.
AI mã nguồn mở cho robot
Thị giác máy tính, từng là một vấn đề khó khăn, đã có những tiến bộ đáng kể chỉ trong vài năm, theo ông Spencer Huang, Giám đốc sản phẩm robot của Nvidia. Những gì trước đây đòi hỏi chuyên môn đáng kể giờ đây có thể được thực hiện chỉ với vài dòng mã. Các công cụ mô phỏng đã trở nên đủ chính xác để hữu ích cho việc đào tạo, và quyền truy cập vào các công cụ mà trước đây đòi hỏi một phòng thí nghiệm chuyên biệt giờ đây đã có sẵn rộng rãi, phần lớn là mã nguồn mở.
Ông nói: "Để tham gia vào lĩnh vực robot, bạn không còn cần bằng tiến sĩ nữa". Kết quả là một lượng lớn người có thể đóng góp, và lĩnh vực này đang bắt đầu trông giống một nền tảng mà bất kỳ ai cũng có thể xây dựng hơn là một chuyên ngành đặc biệt.
Nvidia đã xây dựng một bộ công cụ robot mã nguồn mở bao gồm toàn bộ quy trình phát triển. Các mô hình thế giới Cosmos của họ tạo ra dữ liệu đào tạo tổng hợp và mô phỏng môi trường vật lý. Các mô hình GR00T của họ cung cấp cho robot khả năng lập luận và thực hiện các nhiệm vụ phức tạp.
Các framework Isaac của hãng xử lý việc điều phối, kết nối quá trình huấn luyện, mô phỏng và triển khai. Ông Huang cho biết không phải ai cũng cần huấn luyện robot từ đầu và hầu hết mọi người có lẽ không nên làm điều đó.
Ông nói: “Nếu bạn hạn chế việc huấn luyện trước, lĩnh vực này sẽ không bao giờ phát triển. Chúng ta nên có khả năng cung cấp một mô hình được huấn luyện trước chất lượng cao, hiện đại mà bất kỳ ai cũng có thể sử dụng và tinh chỉnh cho mục đích riêng của mình”.
Tất cả các mô hình mã nguồn mở của Nvidia đều có trên Hugging Face, nền tảng AI mã nguồn mở đã trở thành nơi mặc định để chia sẻ các mô hình và bộ dữ liệu. Hugging Face đã ra mắt LeRobot, một nền tảng cộng đồng dành cho AI robot, vào tháng 5/2024. Kể từ khi ra mắt, số lượng bộ dữ liệu robot trên nền tảng này đã tăng từ 1.145 vào cuối năm 2024 lên hơn 58.000 hiện nay, trở thành danh mục bộ dữ liệu lớn nhất trên trung tâm này.
Hugging Face cũng đã chuyển sang lĩnh vực phần cứng, mua lại công ty robot Pollen Robotics. Theo Clement Delangue, Giám đốc điều hành của Hugging Face, việc mua lại này xuất phát từ nhận thức rằng phần mềm thôi là chưa đủ. Mục tiêu, cũng như với phần mềm, là thu hút nhiều người tham gia hơn.
Những người đóng góp cho LeRobot bao gồm các tên tuổi lớn nhất trong ngành, các phòng thí nghiệm học thuật và những người có sở thích tự chế tạo robot trong thời gian rảnh rỗi. Chẳng hạn, đầu năm nay, Alibaba đã phát hành RynnBrain, một mô hình nền tảng mã nguồn mở cho AI vật lý mà công ty tuyên bố vượt trội so với các sản phẩm tương đương của Google và Nvidia trên các tiêu chuẩn. Ông Delangue cho biết sự đa dạng của các dự án là rất quan trọng.
Ông nói: “Đó không chỉ là một mô hình hay một bộ dữ liệu hay một phần cứng. Đó là rất nhiều đóng góp nhỏ mà mọi người đều có thể tham gia”.
Các động lực thương mại làm phức tạp lĩnh vực này.
Ông Delangue cho biết những rủi ro vượt xa sự tiện lợi. Một thế giới mà chỉ một vài hệ thống độc quyền kiểm soát robot trong nhà của mọi người là một điều đáng lo ngại. Ông nói: “Việc có robot ở nhà mà bạn không thực sự hiểu, không thực sự kiểm soát, mà một vài người ở Thung lũng Silicon kiểm soát là một suy nghĩ đáng sợ. Mã nguồn mở mang đến một con đường thay thế”.
Nhưng để đạt được điều đó không hề đơn giản. Việc mã nguồn mở đang diễn ra hiện nay khác với những gì đã tạo ra ROS, vốn chủ yếu xuất phát từ các học giả tập hợp công việc của họ mà không có lợi ích thương mại trong kết quả. Những người đóng góp lớn nhất hiện nay là các công ty có lý do kinh doanh rõ ràng để muốn nhiều người hơn xây dựng trên nền tảng của họ. Điều đó không nhất thiết là một điều xấu, theo Bill Smart, giáo sư tại Đại học Bang Oregon, ở Corvallis, người đã tham gia vào
Nguồn tin: IEEE Spectrum AI — Tác giả: Jackie Snow. Bản dịch tiếng Việt do AI thực hiện, có thể có sai sót.