Bỏ qua tới nội dung chính
Quay lại tin tức

Tại sao AI vẫn chưa thể giải quyết bài toán tối ưu hóa toán học thực tế của bạn

Towards Data Science· Guangrui Xie· 28/5/2026general

Và những gì ORPilot thực hiện khác biệt Bài viết Why AI Still Can’t Solve Your Real Mathematical Optimization Problem xuất hiện lần đầu trên Towards Data Science.

AI tác nhân Vì sao AI vẫn chưa thể giải quyết vấn đề tối ưu hóa toán học thực tế của bạn Và những điểm khác biệt của ORPilot Guangrui Xie Ngày 28/5/2026 10 phút đọc Chia sẻ Ảnh được tạo bằng Gemini Nếu bạn từng cố gắng sử dụng AI để xây dựng mô hình tối ưu hóa toán học cho một vấn đề kinh doanh thực tế, có lẽ bạn đã gặp phải cùng một trở ngại: AI hoạt động hoàn hảo với các ví dụ trong sách giáo khoa nhưng lại thất bại ngay khi bạn cung cấp dữ liệu và vấn đề thực tế của mình. Khoảng cách đó không phải là sự trùng hợp. Đó là do thiết kế, và đó là lý do tôi xây dựng ORPilot. Lời hứa về tối ưu hóa được hỗ trợ bởi AI Nghiên cứu Vận trù học (OR) đã âm thầm hỗ trợ một số quyết định có tác động lớn nhất trong kinh doanh trong nhiều thập kỷ — định tuyến xe tải giao hàng, lên lịch sản xuất nhà máy, thiết kế chuỗi cung ứng, phân bổ hàng hóa cho các nhà vận chuyển. Toán học đã hoàn thiện và các công cụ giải quyết rất xuất sắc. Nút thắt cổ chai luôn là chuyên môn của con người cần thiết để chuyển đổi một vấn đề kinh doanh thành một mô hình toán học. Các mô hình ngôn ngữ lớn (LLM) dường như là giải pháp hoàn hảo. Một lượng lớn nghiên cứu ngày càng tăng, bao gồm chuỗi OptiMUS, OR-LLM và các nghiên cứu khác, đã chỉ ra rằng các LLM tiên tiến có thể tạo ra mã giải quyết chính xác cho các bài toán quy hoạch tuyến tính (LP) và quy hoạch nguyên hỗn hợp (MIP) được xác định rõ ràng. Kết quả trông rất ấn tượng. Các bản demo rất thuyết phục. Sau đó, bạn cố gắng sử dụng một trong những công cụ này cho một vấn đề thực tế, và những vết nứt xuất hiện ngay lập tức. Nơi các công cụ hiện có bị hỏng Hầu hết mọi công cụ LLM-for-OR được xây dựng cho đến nay đều chia sẻ một giả định ẩn: mô tả vấn đề là hoàn chỉnh, không mơ hồ và được cung cấp cho AI trong một lời nhắc duy nhất, được định dạng tốt với tất cả dữ liệu được nhúng gọn gàng. Đó không phải là cách các vấn đề OR thực tế hoạt động. Hoàn toàn không. Hãy xem xét điều gì thực sự xảy ra khi một nhóm chuỗi cung ứng muốn xây dựng một mô hình tối ưu hóa: Mô tả vấn đề không đầy đủ và mơ hồ. Một nhà phân tích kinh doanh sẽ nói "chúng tôi muốn giảm thiểu chi phí vận chuyển" và quên đề cập rằng mỗi trung tâm phân phối có giới hạn thông lượng, rằng một số tuyến đường không tồn tại, hoặc rằng việc mở một cơ sở phát sinh chi phí cố định một lần. Những thiếu sót này không phải là sự bất cẩn. Đó là những giả định mà nhà phân tích coi là hiển nhiên, đó chính xác là lý do tại sao chúng nguy hiểm. Một hệ thống AI bắt đầu mô hình hóa trước khi các chi tiết này được xác định sẽ tạo ra một mô hình đúng về mặt kỹ thuật nhưng sai về mặt thực tế. Dữ liệu quá lớn để vừa trong một lời nhắc. Một vấn đề chuỗi cung ứng thực tế có thể liên quan đến hàng trăm địa điểm sản xuất, trung tâm phân phối, khách hàng và hàng nghìn sản phẩm trong nhiều khoảng thời gian. Bảng nhu cầu riêng có thể có hàng triệu mục. Bạn không thể nhúng điều đó vào một lời nhắc. Ngay cả khi bạn có thể, việc làm ngập cửa sổ ngữ cảnh bằng dữ liệu thô làm tăng đáng kể nguy cơ ảo giác. Dữ liệu bạn có không phải là dữ liệu mà mô hình cần. Mô hình có thể cần một ma trận khoảng cách giữa tất cả các cặp vị trí. Những gì bạn có là một bảng tọa độ GPS. Mô hình có thể cần tổng nhu cầu theo sản phẩm và khoảng thời gian. Những gì bạn có là một sổ cái giao dịch với một hàng cho mỗi đơn hàng. Thu hẹp khoảng cách này, cụ thể là tính toán các tham số dẫn xuất từ dữ liệu thô, là một bước kỹ thuật quan trọng mà không có công cụ LLM-for-OR hiện có nào xử lý tự động. Khi có một mô hình hoạt động, tính di động và khả năng tái tạo trở nên quan trọng. Nếu muốn chạy lại mô hình trên dữ liệu đã cập nhật, chuyển từ Gurobi sang một bộ giải mã nguồn mở, hoặc chuyển giao mô hình cho đồng nghiệp trên một máy khác, sẽ phải bắt đầu lại từ đầu trừ khi công cụ tạo ra một sản phẩm bền vững, không phụ thuộc vào bộ giải mã. Hầu hết các công cụ chỉ tạo ra mã cụ thể cho bộ giải mã và không có gì khác. Đây không phải là những trường hợp ngoại lệ. Chúng là những điều kiện tiêu chuẩn cho bất kỳ triển khai Vận trù học (OR) thực tế nào. Các công cụ LLM-for-OR hiện có được xây dựng cho một thế giới khác, một thế giới sách giáo khoa, và chúng bộc lộ những hạn chế ngay khi rời khỏi thế giới đó. Giới thiệu ORPilot ORPilot là một tác nhân AI mã nguồn mở được xây dựng từ đầu cho các điều kiện sản xuất. Theo hiểu biết của tôi, đây là công cụ OR dựa trên LLM đầu tiên được thiết kế rõ ràng cho thực tế phức tạp, quy mô lớn, nhiều dữ liệu của tối ưu hóa công nghiệp. Hầu hết các công cụ AI để tối ưu hóa đều bắt đầu viết mã ngay khi mô tả vấn đề. ORPilot làm điều gì đó khác biệt: nó đặt câu hỏi trước. Quyết định thiết kế đó, ưu tiên sự hiểu biết hơn tốc độ, phản ánh một nguyên tắc hướng dẫn duy nhất: một tác nhân AI nên hoạt động giống như một chuyên gia tư vấn OR có kỹ năng. Một chuyên gia tư vấn giỏi không bước vào cuộc họp với khách hàng và bắt đầu viết một mô hình toán học trên bảng trắng. Họ đặt câu hỏi. Họ lắng nghe cẩn thận. Họ phản biện khi có điều gì đó mơ hồ. Họ đảm bảo dữ liệu ở đúng định dạng trước khi bắt đầu mô hình hóa. Chỉ sau tất cả những điều đó, họ mới cầm bút. Quy trình của ORPilot phản ánh kỷ luật này thông qua năm giai đoạn được kết nối tuần tự. Giai đoạn 1: Tác nhân phỏng vấn Tác nhân phỏng vấn là điểm khởi đầu. Nó nhận mô tả ban đầu về vấn đề kinh doanh, có thể mơ hồ, không đầy đủ hoặc thậm chí mâu thuẫn, và tham gia vào một cuộc đối thoại có cấu trúc để điền vào các khoảng trống. Nguyên tắc thiết kế chính là không bắt đầu mô hình hóa cho đến khi cuộc phỏng vấn hoàn tất. Tác nhân được nhắc nhở xác định các khoảng trống thông tin trong mô tả hiện tại, đặt tối đa một câu hỏi làm rõ có mục tiêu mỗi lượt (để tránh làm người dùng choáng ngợp), và kết thúc khi hàm mục tiêu, biến quyết định, ràng buộc và yêu cầu dữ liệu đều được chỉ định rõ ràng. Trong thực tế, điều này có nghĩa là các cuộc trò chuyện như: ORPilot: "Khi một cơ sở được mở, nó có duy trì hoạt động trong tất cả các giai đoạn tiếp theo không, hay có thể đóng cửa sau này?" ORPilot: "Mô hình này xử lý một loại sản phẩm hay nhiều sản phẩm?" ORPilot: "Bạn đã đề cập đến chi phí vận chuyển. Chi phí này là trên mỗi đơn vị vận chuyển, trên mỗi chuyến hàng bất kể số lượng, hay là một loại chi phí khác?" Trước khi kết thúc

Nguồn tin: Towards Data Science — Tác giả: Guangrui Xie. Bản dịch tiếng Việt do AI thực hiện, có thể có sai sót.