Karpathy nói hãy loại bỏ kỹ thuật nhắc lệnh. Đây là ý nghĩa…

Cộng đồng mạng đã tuyên bố một "tang lễ". Tuy nhiên, đối tượng được nhắc đến vẫn chưa "qua đời". Tháng 6 năm ngoái, Andrej Karpathy – cựu Giám đốc AI của Tesla, đồng sáng lập OpenAI và là một trong số ít người trong lĩnh vực này có những bài đăng ngẫu hứng thường xuyên định hình lại cách hàng nghìn nhà phát triển làm việc – đã đăng một điều gây chấn động như một vụ phá dỡ có kế hoạch. Ông viết trên X: “+1 cho ‘kỹ thuật ngữ cảnh’ thay vì ‘kỹ thuật nhắc lệnh’”. “Mọi người liên tưởng nhắc lệnh với các mô tả nhiệm vụ ngắn gọn mà bạn sẽ cung cấp cho một LLM (mô hình ngôn ngữ lớn) trong quá trình sử dụng hàng ngày. Trong khi đó, ở mọi ứng dụng LLM cấp công nghiệp, kỹ thuật ngữ cảnh là nghệ thuật và khoa học tinh tế của việc điền vào cửa sổ ngữ cảnh.”

Cộng đồng mạng đã tuyên bố một đám tang. Nhưng đối tượng không chết. Tháng 6 năm ngoái, Andrej Karpathy – cựu Giám đốc AI của Tesla, đồng sáng lập OpenAI, và là một trong số ít người trong lĩnh vực này có những bài đăng ngẫu nhiên thường xuyên định hình lại cách hàng nghìn nhà phát triển làm việc – đã đăng một điều gây chấn động như một vụ phá hủy có kế hoạch. Ông viết trên X: “+1 cho ‘kỹ thuật ngữ cảnh’ (context engineering) thay vì ‘kỹ thuật nhắc lệnh’ (prompt engineering)”. “Mọi người liên tưởng nhắc lệnh với các mô tả nhiệm vụ ngắn gọn mà bạn đưa cho một LLM (mô hình ngôn ngữ lớn) trong quá trình sử dụng hàng ngày. Trong khi đó, ở mọi ứng dụng LLM cấp công nghiệp, kỹ thuật ngữ cảnh là nghệ thuật và khoa học tinh tế của việc điền cửa sổ ngữ cảnh với đúng thông tin cho bước tiếp theo.” Giám đốc điều hành Shopify Tobi Lütke đã khuếch đại thông điệp này chỉ trong vài giờ. Simon Willison, một trong những tiếng nói cẩn trọng nhất trong cộng đồng nhà phát triển AI, viết rằng “kỹ thuật nhắc lệnh” đã bị “định nghĩa lại thành việc gõ các nhắc lệnh đầy những thủ thuật ngớ ngẩn vào một chatbot” và rằng kỷ luật nghiêm túc mà nó từng chỉ ra đã bị chôn vùi dưới hai năm của các chủ đề bẻ khóa trên Twitter. Đến tháng 7, Gartner đã công bố: “Kỹ thuật ngữ cảnh đang thịnh hành, và kỹ thuật nhắc lệnh đã lỗi thời.” Phản ứng là ngay lập tức và mang tính phe phái. Nhóm Kỹ thuật Ngữ cảnh cho rằng kỹ thuật nhắc lệnh luôn là một trò lừa bịp. Họ chỉ ra những thất bại sản xuất thực tế: các nhắc lệnh hệ thống phức tạp làm giảm hiệu suất mô hình, các hướng dẫn nhân cách làm rối loạn việc tuân thủ hướng dẫn, các mẫu chuỗi suy nghĩ hoạt động trong bản demo nhưng hỏng trong sản xuất. “Kỹ thuật nhắc lệnh dễ thương cho các bản demo,” là câu nói phổ biến. “Nhưng AI trong thế giới thực cần cấu trúc. Bộ nhớ. Lịch sử. Công cụ. Dữ liệu.” Nhóm Kỹ thuật Nhắc lệnh phản bác. Đây chỉ là việc đổi tên. Nhắc lệnh hệ thống vẫn tồn tại. Các ví dụ ít shot vẫn hoạt động. Bạn vẫn đang viết hướng dẫn cho một mô hình – bạn chỉ đổi tên hoạt động để nghe có vẻ nghiêm túc hơn. “Kỹ thuật ngữ cảnh chỉ là kỹ thuật nhắc lệnh với ngân sách PR.” Cả hai phe đều hiểu sai những gì Karpathy thực sự nói. Những gì Karpathy Thực sự Nói Đọc lại bài đăng, lập luận hẹp hơn và cụ thể hơn so với cách cả hai bên đã xử lý. Karpathy không nói rằng việc viết hướng dẫn cho AI đã chết. Ông nói rằng thuật ngữ “kỹ thuật nhắc lệnh” đã bị chiếm đoạt bởi một quan niệm về công việc không phù hợp với những gì các ứng dụng AI sản xuất nghiêm túc thực sự yêu cầu. Thất bại cụ thể mà ông xác định: mọi người coi “nhắc lệnh” là thứ bạn gõ trước khi mô hình phản hồi. Nhưng trong bất kỳ ứng dụng AI thực sự nào – một tác nhân viết mã, một chatbot xử lý các truy vấn của khách hàng, một quy trình xử lý tài liệu – thứ mà mô hình nhìn thấy không chỉ là một nhắc lệnh. Đó là một cửa sổ ngữ cảnh, được lắp ráp trong thời gian chạy từ nhiều nguồn: hướng dẫn hệ thống, tài liệu được truy xuất, lịch sử hội thoại, đầu ra công cụ, bộ nhớ, siêu dữ liệu người dùng và các bước suy luận trung gian. Quản lý việc lắp ráp đó – quyết định cái gì vào, cái gì ra, theo thứ tự nào, ở mức độ chi tiết nào – là vấn đề kỹ thuật thực sự. Nó không liên quan một cách tầm thường đến câu hỏi về cách diễn đạt mô tả nhiệm vụ. Gọi nó là “kỹ thuật nhắc lệnh” cho thấy nút thắt cổ chai là lựa chọn từ ngữ của bạn. Không phải vậy. Nút thắt cổ chai là kiến trúc. Như Karpathy đã nói trong một bình luận tiếp theo: “Quá ít hoặc sai dạng và LLM không có ngữ cảnh phù hợp để đạt hiệu suất tối ưu. Quá nhiều hoặc quá không liên quan, và chi phí LLM có thể tăng lên, và hiệu suất có thể giảm xuống. Làm tốt điều này là cực kỳ không tầm thường.” Ông không tuyên bố một đám tang. Ông đang chỉ vào một cánh cửa bị dán nhãn sai. Khi Kỹ thuật Ngữ cảnh là Khung phù hợp nâng cấp có ý nghĩa từ kỹ thuật nhắc lệnh (prompt engineering) truyền thống đều có chung một đặc tính: hiệu suất của mô hình bị giới hạn bởi những gì nó có thể truy cập, chứ không phải bởi cách bạn yêu cầu một cách khéo léo. Quy trình làm việc theo tác nhân (agentic workflows). Khi một tác nhân thực hiện nhiều bước — lập kế hoạch, sử dụng công cụ, thực thi mã, tổng hợp kết quả — mỗi bước yêu cầu một ngữ cảnh được tập hợp mới. Những gì tác nhân cần ở bước 4 không giống với những gì nó cần ở bước 1. Một lời nhắc hệ thống tĩnh không thể xử lý điều này. Bạn cần quản lý những gì được chuyển tiếp, những gì được nén, những gì được truy xuất từ bộ nhớ và những gì bị loại bỏ. Một lời nhắc tác nhân đơn giản trông như thế này: Bạn là một trợ lý kỹ sư phần mềm hữu ích. Bạn có quyền truy cập vào các công cụ sau: run_code, search_web, read_file, write_file. Hoàn thành nhiệm vụ của người dùng từng bước một. Hãy cẩn thận, kỹ lưỡng và chính xác. Luôn giải thích lý do của bạn. Một tác nhân được thiết kế ngữ cảnh sẽ điền vào cửa sổ khác nhau ở mỗi bước: [HỆ THỐNG]: Bạn là một tác nhân đánh giá mã. Chỉ tập trung vào nhiệm vụ hiện tại. [ĐÃ TRUY XUẤT]: PR diff cho auth.py — 127 dòng đã sửa đổi [KẾT QUẢ CÔNG CỤ]: Đầu ra phân tích tĩnh — 3 cảnh báo, 1 lỗi [BỘ NHỚ]: Phiên trước: người dùng thích bình luận nội tuyến hơn báo cáo tóm tắt [NHIỆM VỤ]: Đánh giá các thay đổi xác thực về các vấn đề bảo mật Sự khác biệt không nằm ở cách chọn từ. Mà là những gì có trong phòng khi mô hình bắt đầu hoạt động. Ứng dụng RAG. Tạo sinh tăng cường truy xuất (Retrieval-augmented generation) thành công hay thất bại phụ thuộc vào việc lắp ráp ngữ cảnh. Bạn có thể có lời nhắc hệ thống hùng hồn nhất thế giới, nhưng nếu bạn truy xuất sai các đoạn — quá nhiều, quá ít, độ chi tiết sai, thứ tự sai — mô hình không thể bù đắp được. Một nghiên cứu năm 2025 từ Trung tâm Nghiên cứu về Mô hình Nền tảng của Stanford cho thấy chất lượng truy xuất chiếm nhiều biến động đầu ra hơn so với việc lựa chọn mô hình trên các tiêu chuẩn QA (Hỏi đáp) thông thường. Các quy trình dài hạn. Khi các mô hình được xâu chuỗi — đầu ra của bước N trở thành đầu vào của bước N+1 — sự ô nhiễm ngữ cảnh tích lũy. Lý luận trung gian hữu ích ở một bước trở thành nhiễu ở bước tiếp theo nếu nó không được quản lý. Vấn đề kỹ thuật là quyết định cái gì cần nén, tóm tắt hoặc loại bỏ giữa các bước. Không có thủ thuật nhắc lệnh nào có thể thay thế được điều này. Nơi kỹ thuật nhắc lệnh vẫn là công việc thực sự Việc định hình lại của Karpathy không làm cho lời nhắc hệ thống của bạn trở nên không liên quan. Đây là nơi thiết kế hướng dẫn cẩn thận vẫn chi phối kết quả: Các tác vụ có cấu trúc một lượt. Khi bạn yêu cầu một mô hình chuyển đổi tài liệu, phân loại đầu vào, trích xuất dữ liệu có cấu trúc từ văn bản hoặc tạo ra một cái gì đó để

Karpathy nói hãy loại bỏ kỹ thuật nhắc lệnh. Đây là ý nghĩa thực sự của ông ấy.