Bỏ qua tới nội dung chính
Quay lại tin tức

Thời đại của các tác nhân bất đồng bộ — Walden Yan của Cognition và Cole Murray của OpenInspect

Latent Space· 28/5/2026models

Trang web AIEWF mới đã chính thức hoạt động. Thời hạn nộp hồ sơ (CFP) sẽ kết thúc sau 2 ngày và chúng tôi sẽ tổ chức buổi Định hướng Kỹ sư Mới đầu tiên vào cuối tuần này. Hãy nhanh chóng đặt vé vì vé sẽ hết rất nhanh. Tham gia Khảo sát Kỹ thuật AI để nhận hơn 2.000 USD tín dụng và vé AIE WF miễn phí! Một trong những mâu thuẫn cốt lõi trong ngành công nghiệp tác nhân (agents) là mặc dù có những phòng thí nghiệm tác nhân quy mô lớn trị giá hàng chục tỷ USD như Sierra, Decagon, Notion và Cursor đang được xây dựng, nhưng việc tự phát triển tác nhân (DIY agents) cũng chưa bao giờ dễ dàng hơn thế, với vô số các framework tác nhân như LangGraph, Pydantic và Flue, cùng các tác nhân được quản lý từ Anthropic và Gemini.

Trang web AIEWF mới đã hoạt động! Thời hạn nộp hồ sơ CFP (Lời kêu gọi đề xuất) sẽ kết thúc sau 2 ngày và chúng tôi sẽ tổ chức buổi Định hướng Kỹ sư Mới đầu tiên vào cuối tuần này. Hãy đặt vé ngay lập tức vì vé sẽ hết. Tham gia Khảo sát Kỹ thuật AI và nhận hơn 2.000 USD tín dụng cùng vé AIE WF miễn phí! Một trong những mâu thuẫn cốt lõi trong ngành công nghiệp tác nhân (agents) là ngay cả khi các phòng thí nghiệm tác nhân lớn trị giá hàng chục tỷ USD như Sierra, Decagon, Notion và Cursor đang được xây dựng, thì việc tự tạo tác nhân cũng chưa bao giờ dễ dàng hơn thế, với vô số khung tác nhân như LangGraph, Pydantic và Flue, cùng các tác nhân được quản lý từ Anthropic, Gemini và Amazon. Đã có một làn sóng các công ty xây dựng tác nhân nền tảng của riêng họ, từ Shopify đến Stripe, Paradigm đến Razorpay, và thậm chí cả bạn bè của Cognition là Ramp cũng đã xây dựng tác nhân mã hóa của riêng họ với một người bạn khác là Modal. Bạn có thể nghĩ Cognition có thể cảm thấy bị đe dọa một chút, nhưng họ không như vậy – ngay cả sau tất cả những điều này, họ đã nhận được số tiền đăng ký vượt xa mức cần thiết cho vòng gọi vốn Series D trị giá 1 tỷ USD mà họ vừa công bố: @Lux_Capital, @generalcatalyst, và @8vc.\n\nViệc sử dụng doanh nghiệp của chúng tôi đã tăng hơn 10 lần kể từ đầu năm nay, và doanh thu theo tỷ lệ hàng năm của chúng tôi đã tăng lên 492 triệu USD.\n\nChúng tôi đã ra mắt Devin hai năm trước với tư cách là kỹ sư phần mềm AI đầu tiên. Kể từ đó, Walden Yan, người đặt ra thuật ngữ kỹ thuật ngữ cảnh (context engineering) và là Giám đốc Sản phẩm/Đồng sáng lập của Cognition, đã mời Cole Murray của OpenInspect nói về lý do "Devin nằm trong chi tiết" (Devin is in the Details). Cuộc trò chuyện đầy đủ đã có trên podcast hôm nay: Nhìn lại, các tác nhân bất đồng bộ (async agents) là đặt cược "AGI pilled" nhất mà bạn có thể thực hiện vào năm 2024 – các mô hình chưa đủ tốt để "vibecode", và mọi người chưa đủ tin tưởng AI để cho nó tự hoạt động, không ai (kể cả Cognition ban đầu) chắc chắn về các yếu tố hình thức. Bây giờ thì rõ ràng: Làn sóng đầu tiên của các công cụ mã hóa AI đã giúp nhà phát triển nhanh hơn nhưng vẫn phụ thuộc nhiều vào sự can thiệp của con người. Các ví dụ điển hình là tính năng tự động hoàn thành tab của Copilot và Cursor. Tuy nhiên, quy trình làm việc vẫn tập trung nhiều vào và bị tắc nghẽn bởi quy trình làm việc cục bộ của nhà phát triển: một nhà phát triển trong môi trường phát triển tích hợp (IDE), theo dõi mô hình, chấp nhận hoặc từ chối các thay đổi và đẩy mã từng tương tác một. Làn sóng thứ hai là các tác nhân cục bộ: Claude Code, Windsurf, bảng tác nhân của Cursor: ban đầu là một và ngày càng nhiều thiết bị đầu cuối chạy đồng thời. Kỷ nguyên hiện tại của các tác nhân bất đồng bộ chỉ ra một tương lai khác tập trung nhiều hơn vào việc điều phối tác nhân (agent orchestration) nhằm thúc đẩy phát triển từ đầu đến cuối. Theo khách mời trước đây Steve Yegge, có 8 cấp độ chi tiết hơn về việc áp dụng tác nhân, nhưng chúng tôi đã rút gọn thành ba. Như Michael Truell của Cursor đã nói trong "Kỷ nguyên thứ ba của phát triển phần mềm AI": Cursor không còn chủ yếu là về việc viết mã. Nó là về việc giúp các nhà phát triển xây dựng nhà máy tạo ra phần mềm của họ. Nhà máy này được tạo thành từ các đội tác nhân mà họ tương tác như đồng đội: cung cấp hướng dẫn ban đầu, trang bị cho họ các công cụ để làm việc độc lập và xem xét công việc của họ. Tác nhân không nên chỉ hoạt động trong luồng làm việc của nhà phát triển. Nó cần được thiết lập để hoạt động ở chế độ nền, cho phép người dùng giao nhiệm vụ, kho lưu trữ (repo), máy tính, shell, trình duyệt, các bài kiểm tra, bộ nhớ và các vòng lặp đánh giá để thực hiện công việc ở một nơi khác. Trong chưa đầy một năm, quan điểm đã chuyển từ việc tránh các hệ thống đa tác nhân: sang đề xuất các phương pháp tiếp cận thực sự hiệu quả: Từ việc đặt ra thuật ngữ "kỹ thuật ngữ cảnh" (context engineering) đến việc xây dựng cơ sở hạ tầng đằng sau sự tăng trưởng 7 lần của các yêu cầu kéo (PR) đã hợp nhất của Devin và sự gia tăng từ 16% lên 80% số lượt cam kết (commits) trên các kho lưu trữ của Cognition, Walden Yan đã chứng kiến trực tiếp sự thay đổi sang tác nhân nền. Trong tập này, đồng sáng lập và CPO của Cognition, Walden Yan, cùng với Swyx và Cole Murray, người tạo ra OpenInspect, sẽ phân tích lý do tại sao mọi người đang xây dựng Devin của riêng họ, điều gì đã thay đổi sau bước ngoặt mô hình tháng 12/2025 và tại sao "từ đặc tả đến yêu cầu kéo" (spec to pull request) hiện đang trở thành một quy trình sản xuất thực sự. Chúng tôi đi sâu vào kiến trúc của các tác nhân nền: hệ thống tích hợp sẵn (harness-in-the-box) so với hệ thống bên ngoài (out-of-the-box), lý do Devin tách "bộ não" khỏi máy tính, tại sao việc thiết lập kho lưu trữ vẫn là một trong những vấn đề khó khăn nhất, tại sao Docker không phải lúc nào cũng đủ, và cách các máy ảo (VM) đầy đủ, ảnh chụp nhanh (snapshots), bí mật có phạm vi (scoped secrets), bot GitHub, tích hợp Slack và kiểm thử dựa trên video đều kết hợp với nhau. Walden và Cole cũng đi sâu vào bộ nhớ, các giới hạn của MCP, điều phối đa tác nhân, đánh giá mã bằng AI, tự động phân loại sự cố SRE, các quản lý sản phẩm (PM) triển khai mã từ Slack, Windsurf 2.0, các hệ thống lai tiền tuyến/hậu tuyến (hybrid frontier/sub-frontier systems) và chế độ lỗi thực sự của việc lập trình theo cảm hứng không kiểm soát: cơ sở mã của bạn thoái hóa về mức độ của kỹ sư tệ nhất. Và khi các tác nhân "ăn" phần mềm... và phần mềm "ăn" thế giới... bạn có thể rút ra kết luận về những gì tiếp theo: Chúng tôi thảo luận: Tại sao thế giới kỹ thuật đang nhận ra tầm quan trọng của các tác nhân nền và tác nhân đám mây. Bước ngoặt mô hình tháng 12/2025 đã biến quy trình làm việc từ đặc tả đến yêu cầu kéo trở nên khả thi. Sự tăng trưởng 7 lần của các yêu cầu kéo đã hợp nhất của Devin và sự gia tăng từ 16% lên 80% số lượt cam kết. Lý do Cole xây dựng OpenInspect như một hệ thống tác nhân nền mã nguồn mở. Kinh tế của các sản phẩm tác nhân giá 20 USD/người dùng và tại sao việc kiếm tiền lại khó khăn. Những gì Cognition thực sự bán ngoài Devin: cơ sở hạ tầng, hướng dẫn sử dụng, tích hợp và áp dụng. Hệ thống tích hợp sẵn so với hệ thống bên ngoài, và tại sao kiến trúc lại quan trọng. Lý do Devin tách bộ não khỏi máy tính vì lý do bảo mật và quyền hạn. Thiết lập kho lưu trữ, bí mật có phạm vi, Docker Compose và môi trường phát triển sẵn sàng cho tác nhân. Tại sao các máy ảo đầy đủ lại quan trọng khi các tác nhân cần chạy các ứng dụng thực và kiểm thử chúng. Android, macOS, Windows, ảo hóa lồng nhau và công việc tác nhân cụ thể cho từng máy. Tại sao việc kiểm thử là rất quan trọng.

Nguồn tin: Latent Space. Bản dịch tiếng Việt do AI thực hiện, có thể có sai sót.