Sarang Kulkarni về những bài học từ việc xây dựng các tác nhân…

Các hệ thống tác tử nghiên cứu chuyên sâu (Deep Research Agentic Systems) là các tác tử AI được thiết kế để thực hiện nghiên cứu đa bước cho các nhiệm vụ phức tạp, sử dụng lập luận động, truy xuất thông tin đa bước và tạo ra các báo cáo phân tích có cấu trúc. Sarang Kulkarni từ Thoughtworks đã phát biểu tại Hội nghị Arc of AI 2026 về cách triển khai các hệ thống nghiên cứu đa tác tử để lập luận chuyên sâu và những bài học kinh nghiệm từ việc phát triển các tác tử nghiên cứu chuyên sâu. Theo Srini Penchikala

Trang chủ InfoQ Tin tức Sarang Kulkarni về những bài học từ việc xây dựng các tác nhân nghiên cứu chuyên sâu trong sản xuất AI, ML & Kỹ thuật dữ liệu Sarang Kulkarni về những bài học từ việc xây dựng các tác nhân nghiên cứu chuyên sâu trong sản xuất Ngày 27/5/2026 3 phút đọc bởi Srini Penchikala Viết cho InfoQ Thỏa mãn sự tò mò của bạn. Giúp hơn 550 nghìn nhà phát triển cấp cao trên toàn cầu mỗi tháng luôn dẫn đầu. Liên hệ Nghe bài viết này - 0:00 Âm thanh sẵn sàng phát Trình duyệt của bạn không hỗ trợ phần tử âm thanh. 0:00 0:00 Bình thường 1.25x 1.5x Thích Danh sách đọc Các hệ thống tác nhân nghiên cứu chuyên sâu (Deep Research Agentic Systems), như OpenAI và Gemini Deep Research Agent, là các tác nhân AI được thiết kế để thực hiện nghiên cứu đa bước trên internet cho các tác vụ phức tạp, sử dụng suy luận động, truy xuất thông tin đa bước và tạo ra các báo cáo phân tích toàn diện, có cấu trúc ở cấp độ của một nhà phân tích nghiên cứu. Ông Sarang Kulkarni từ nhóm Thoughtworks đã phát biểu tại Hội nghị Arc of AI 2026 về cách thiết kế và triển khai các hệ thống nghiên cứu đa tác nhân để suy luận và tổng hợp chuyên sâu, cùng với những bài học kinh nghiệm từ các dự án R&D dược phẩm và chăm sóc sức khỏe trong thế giới thực đang phát triển các tác nhân nghiên cứu chuyên sâu. Ông cũng thảo luận về cách nhóm đã tận dụng các kỹ thuật như vòng lặp tác nhân (agentic loops) và kỹ thuật khai thác (harness engineering) để đạt được hiệu quả tốt nhất từ giải pháp. Trong các ngành công nghiệp quan trọng như chăm sóc sức khỏe và thử nghiệm lâm sàng, các nhà nghiên cứu cần nhiều hơn các mô hình AI truyền thống chỉ thực hiện các tác vụ hỏi đáp đơn giản. Họ cần các hệ thống có thể khám phá, kết nối và suy luận trên cả dữ liệu nội bộ và dữ liệu Internet, đồng thời duy trì độ tin cậy, tính minh bạch và tuân thủ. Ông Kulkarni bắt đầu bài thuyết trình bằng cách nhấn mạnh rằng thông thường phải mất 2,6 tỷ USD để đưa một loại thuốc mới ra thị trường. Ngoài ra, khoảng một nửa số nghiên cứu được thực hiện mà không có bằng chứng trước đó vì kiến thức tồn tại, nhưng việc tiếp cận kiến thức và thông tin này bị gián đoạn. Trong toàn bộ quy trình khám phá và phát triển thuốc, việc có được dữ liệu phù hợp vào đúng thời điểm là một thách thức lớn. Với mục tiêu phát minh ra một loại thuốc mới bằng cách sử dụng công nghệ AI, nhóm của ông đã xây dựng một chatbot dựa trên Retrieval Augmented Generation (RAG) hai năm trước để tìm kiếm thông qua dữ liệu phi cấu trúc. Đối với các truy vấn đơn giản trong nghiên cứu, giải pháp RAG hoạt động tốt, nhưng đối với các câu hỏi phức tạp, họ phải nâng cấp nó thành một ứng dụng RAG tác nhân (agentic RAG). Và đối với các trường hợp sử dụng nghiên cứu chuyên sâu, nhóm đã phát triển một giải pháp mà họ gọi là Agentic RAG++. Ông Kulkarni đã chia sẻ chi tiết về hệ thống nghiên cứu chuyên sâu, bao gồm một vòng lặp làm rõ (clarification loop), vòng lặp nghiên cứu (research loop) (để thực hiện các tác vụ suy nghĩ và lập kế hoạch, thực thi, phản ánh, điều chỉnh kế hoạch) và vòng lặp viết (writing loop) tập trung vào các tác vụ viết và phản ánh. Phiên bản ban đầu của tác nhân nghiên cứu dựa trên hai công cụ: công cụ RAG và công cụ text2sql. Thiết kế của công cụ RAG dựa trên tìm kiếm lai có trọng số, 20 đoạn ngữ cảnh, một bộ sắp xếp lại (re-ranker) và bảy đoạn ngữ cảnh được tinh chỉnh. Công cụ text2sql chịu trách nhiệm đưa các lỗi truy vấn SQL trở lại LLM để cải thiện mô hình nhằm đạt được độ chính xác tốt hơn trong việc thực thi truy vấn. Ông đã đề cập đến các yếu tố như chi phí token cao hơn, hiệu suất kém và độ trễ cao có thể dẫn đến việc truy xuất kém từ các tác nhân AI. Lo lắng về ngữ cảnh (context anxiety) là một vấn đề khác mà các nhóm cần thận trọng. Ngoài ra, dữ liệu không đầy đủ có thể dẫn đến tự đánh giá kém, nhưng các kỹ thuật như vòng lặp phản ánh (reflection loop) có thể giúp hoàn thiện dữ liệu. Diễn giả đã thảo luận về các chế độ lỗi khác nhau mà họ phải giải quyết khi phát triển giải pháp tác nhân nghiên cứu chuyên sâu tùy chỉnh. Các tác vụ có tầm nhìn dài (long-horizon tasks) yêu cầu một vòng lặp suy nghĩ-hành động (think-act loop) rõ ràng. Điều này có thể được giải quyết bằng cách kết hợp nhiều bước như suy nghĩ, lập kế hoạch (hoạt động trước khi nghiên cứu), kiểm tra (hoạt động sau khi nghiên cứu hoàn tất và xác thực đầu ra) và cuối cùng là bước cập nhật, thực sự tạo ra báo cáo cuối cùng. Công cụ "think" của Anthropic và các giải pháp tương tự khác có thể giúp chính thức hóa việc tạm dừng suy luận. Ngoài ra, các tác vụ có tầm nhìn dài có xu hướng phá vỡ các quyết định giữa các bước trong quy trình tổng thể. Bước phản ánh trong giải pháp của họ không chỉ bao gồm phản ánh dữ liệu, nhưng cũng là một sự phản ánh quy trình để đánh giá xem quy trình đã hoàn tất hay chưa. Giai đoạn này bao gồm bước phản ánh thứ ba được gọi là Vòng lặp Viết bản nháp, giúp khắc phục các khoảng trống tổng hợp, ví dụ như bất kỳ thông tin nào có trong nghiên cứu nhưng tác vụ viết không nắm bắt được, vì vậy bước viết lại sẽ xử lý điều đó. Kulkarni đã kết thúc bài nói chuyện bằng một cuộc thảo luận về các kỹ thuật kỹ thuật khai thác mới nổi, trong đó việc thiết kế các công cụ, hệ thống bộ nhớ và kiểm tra xác thực, các ràng buộc và vòng lặp phản hồi giúp các tác nhân AI tự trị đáng tin cậy và có trách nhiệm hơn. Mục tiêu của kỹ thuật khai thác là giúp các giải pháp AI chuyển từ chỉ kỹ thuật nhắc lệnh sang tập trung vào việc thực hiện tự động các tác vụ bởi các tác nhân AI. Vì các tác nhân AI về cơ bản là sự kết hợp giữa mô hình và khai thác, các mô hình càng tốt thì khai thác càng mỏng. Về tác giả Srini Penchikala Đánh giá bài viết này Mức độ chấp nhận Phong cách Tác giả đã liên hệ Nội dung này thuộc chủ đề AI, ML & Kỹ thuật dữ liệu. Các chủ đề liên quan: AI, ML & Kỹ thuật dữ liệu AI tạo sinh Trí tuệ nhân tạo Mô hình ngôn ngữ lớn Tác nhân Biên tập viên liên quan

Sarang Kulkarni về những bài học từ việc xây dựng các tác nhân nghiên cứu chuyên sâu trong thực tế