Qwen3.7-Max: LLM mới của Alibaba, ưu tiên tác nhân, dành cho lập trình, suy luận và quy trình công việc AI dài hạn
Đội ngũ Qwen của Alibaba đã công bố Qwen3.7-Max, một mô hình chủ lực được xây dựng cho kỷ nguyên tác nhân (agent era). Không giống như các mô hình ngôn ngữ lớn (LLM) thông thường tập trung vào chatbot, Qwen3.7-Max được thiết kế làm nền tảng cho các tác nhân AI tự chủ có khả năng viết mã, gỡ lỗi, sử dụng công cụ, quản lý quy trình làm việc và thực hiện các tác vụ doanh nghiệp dài hạn. Alibaba tuyên bố mô hình này có thể hoạt động tự chủ tới 35 giờ mà không bị suy giảm hiệu suất.
Qwen3.7-Max: LLM ưu tiên tác tử mới của Alibaba dành cho lập trình
Qwen3.7-Max: LLM ưu tiên tác tử mới của Alibaba dành cho lập trình, suy luận và quy trình làm việc AI dài hạn
Nhóm Qwen của Alibaba đã ra mắt Qwen3.7-Max, một mô hình chủ lực được xây dựng cho kỷ nguyên tác tử. Không giống như các LLM tập trung vào chatbot thông thường, mô hình này được thiết kế làm nền tảng cho các tác tử AI tự động có khả năng lập trình, gỡ lỗi, sử dụng công cụ, quản lý quy trình làm việc và thực hiện các tác vụ doanh nghiệp dài hạn.
Alibaba tuyên bố mô hình có thể hoạt động tự động lên đến 35 giờ mà không suy giảm hiệu suất, đồng thời hỗ trợ hơn 1.000 lệnh gọi công cụ liên tiếp. Trong bài viết này, chúng ta sẽ khám phá kiến trúc, điểm chuẩn, API, quy trình làm việc của tác tử của Qwen3.7-Max và vị trí của nó trong hệ sinh thái LLM đang phát triển.
Mục lục
Qwen3.7-Max là gì?
Tại sao Qwen3.7-Max quan trọng đối với các tác tử AI?
Kiến trúc Qwen3.7-Max
Cách truy cập Qwen3.7-Max
Thực hành: Sử dụng Qwen3.7-Max
Kết luận
Qwen3.7-Max là gì?
Qwen3.7-Max là thành viên mới nhất được bổ sung vào dòng mô hình độc quyền Qwen của Alibaba. Mô hình này được thiết kế cho lập trình tác tử cấp cao, suy luận phức tạp, sử dụng công cụ, tự động hóa quy trình làm việc văn phòng và thực hiện các tác vụ dài hạn. Alibaba thông báo các nhà phát triển và doanh nghiệp trên toàn thế giới sẽ có thể truy cập Alibaba thông qua Alibaba Cloud Model Studio.
Điểm mấu chốt là hiện tại, Qwen3.7-Max không phải là một mô hình mã nguồn mở. Không giống như nhiều phiên bản mã nguồn mở trước đây của Qwen, đây là một mô hình độc quyền được lưu trữ. Điều này không có nghĩa là nó được so sánh với các mô hình cục bộ có thể tải xuống như GPT, Claude, Gemini hoặc các mô hình chủ lực được lưu trữ của DeepSeek.
Các khả năng chính của Qwen3.7-Max
Mã hóa tác nhân: Hỗ trợ tạo mẫu giao diện người dùng, tạo mã, gỡ lỗi, phát triển đa tệp, lệnh terminal, viết thử nghiệm và sửa lỗi theo kiểu GitHub.
Thực thi tác vụ dài hạn: Được thiết kế để xử lý các quy trình làm việc tác nhân mở rộng với nhiều lệnh gọi công cụ, giúp ích cho các tác vụ kỹ thuật phức tạp đòi hỏi sự kiên trì.
Gọi công cụ và quy trình làm việc MCP: Hoạt động tốt trong các môi trường nhiều công cụ, nơi các tác nhân tương tác với hệ thống tệp, trình duyệt, cơ sở dữ liệu, API và ứng dụng doanh nghiệp.
Tự động hóa quy trình làm việc văn phòng: Hỗ trợ tạo tài liệu, phân tích bảng tính, báo cáo, lập kế hoạch, tổng hợp nghiên cứu và tự động hóa quy trình làm việc kinh doanh.
Trợ lý năng suất đồng nghiệp: Hoạt động không chỉ là một công cụ mã hóa hoặc hỏi đáp mà còn hỗ trợ các tác vụ vận hành nhiều bước cho các nhóm kinh doanh và năng suất.
Tại sao Qwen3.7-Max quan trọng đối với các tác nhân AI
Hầu hết các bản phát hành LLM đều tập trung vào nhiều lĩnh vực khác nhau, chẳng hạn như cải thiện trò chuyện, cải thiện khả năng toán học, cải thiện khả năng mã hóa hoặc giảm chi phí suy luận. Thông điệp của Qwen3.7-Max hoàn toàn khác, thông điệp chính của nó là độ tin cậy của tác nhân.
Tác nhân AI không chỉ là một công cụ trả lời câu hỏi. Nó phải lập kế hoạch, gọi công cụ, đọc kết quả, phục hồi sau lỗi, vá mã, xem tệp, chuyển đổi lượt và, trong một tác vụ có thể liên quan đến hàng trăm bước, thực hiện tất cả! Theo Alibaba, Qwen3.7-Max có thể xử lý các tác vụ tự động chuỗi dài, chẳng hạn như hàng nghìn hành động trở lên.
Đây là lý do tại sao các sản phẩm tác nhân sẽ sụp đổ vì nhiều lý do trong sản xuất mà chatbot sẽ không. Một tác nhân loại này có thể hiệu quả chỉ với một phản hồi. Một tác nhân nên biết cả bốn biến của một vòng lặp:
Mục tiêu người dùng → Kế hoạch → Gọi công cụ → Quan sát → Gỡ lỗi → Thử lại → Xác thực → Đầu ra cuối cùng
Qwen3.7-Max được xây dựng xung quanh vòng lặp này.
Kiến trúc Qwen3.7-Max
Alibaba chưa tiết lộ đầy đủ chi tiết về kiến trúc của Qwen3.7-Max, bao gồm số lượng tham số, số lượng chuyên gia, kích thước kích hoạt, thiết kế chú ý hoặc độ dài cửa sổ ngữ cảnh thực tế. Vì vậy, tốt nhất là mô tả kiến trúc của nó theo thiết kế hệ thống tác nhân đã công bố, chiến lược đào tạo và hành vi thời gian chạy.
Kiến trúc tác nhân cấp cao
Đào tạo tác nhân



Nguồn tin: Analytics Vidhya — Tác giả: Harsh Mishra. Bản dịch tiếng Việt do AI thực hiện, có thể có sai sót.