
Các cựu nhà nghiên cứu của Google và Apple đã thành lập một công ty khởi nghiệp nhằm xây dựng vòng phản hồi còn thiếu của AI.
Trajectory đang đặt cược vào chu kỳ lặp lại nhanh chóng, được thúc đẩy bởi phương pháp "vibe-coding", có thể giúp mọi loại hình công ty xây dựng các sản phẩm AI có khả năng học hỏi liên tục.
Maxwell Zeff
Kinh doanh
Ngày 27/5/2026 10:00 SA
Các cựu nhà nghiên cứu của Google và Apple thành lập công ty khởi nghiệp nhằm xây dựng vòng lặp phản hồi còn thiếu của AI
Trajectory đặt cược vào chu kỳ lặp lại nhanh chóng, vốn đã thúc đẩy mạnh mẽ quá trình mã hóa cảm xúc (vibe-coding), có thể giúp mọi loại hình công ty xây dựng các sản phẩm AI học hỏi liên tục.
Các nhà sáng lập Trajectory, Ronak Malde (trái), Michael Elabd (giữa) và Arjun Karanam (phải). Ảnh minh họa: Nhân viên WIRED; Theo Trajectory AI
Một nhóm các nhà nghiên cứu AI từng làm việc tại Google DeepMind, Apple, OpenAI và Meta Superintelligence Labs đã công bố vào thứ Tư rằng họ đang thành lập một công ty khởi nghiệp mới có tên Trajectory, nhằm mục đích giúp các công ty thường xuyên cải thiện sản phẩm AI của mình bằng cách đào tạo dựa trên tương tác thực tế của người dùng.
Trajectory muốn xây dựng một nền tảng cho AI có khả năng học hỏi liên tục, một khả năng mà các nhà nghiên cứu từ lâu đã coi là rào cản lớn đối với sự tiến bộ hơn nữa của AI. OpenAI, Google và Anthropic đã đạt được thành công trong việc đào tạo các phiên bản mô hình AI ngày càng có năng lực, đặc biệt trong các lĩnh vực như mã hóa, toán học và khoa học. Tuy nhiên, các hệ thống này ngừng trở nên thông minh hơn sau khi quá trình đào tạo hoàn tất. Mặc dù đã có một số đột phá gần đây trong học tập liên tục, các công ty công nghệ nhìn chung đã gặp khó khăn trong việc tạo ra các sản phẩm AI học hỏi từ lỗi của chúng trong thời gian thực. Vào tháng 12/2025 tại NeurIPS, một trong những hội nghị nghiên cứu AI thường niên lớn nhất, người đoạt giải Turing Richard Sutton đã lập luận rằng học tập liên tục là điều cần thiết để xây dựng các tác nhân siêu thông minh.
Trajectory đã huy động được 15 triệu USD trong vòng hạt giống với định giá sau đầu tư là 115 triệu USD, do quỹ đầu tư mạo hiểm Conviction dẫn đầu, với sự tham gia của Bessemer Venture Partners, Radical VC và BoxGroup. Các nhà đầu tư cá nhân cũng tham gia vào vòng này, bao gồm nhà khoa học trưởng của Google DeepMind, Jeff Dean, cũng như "mẹ đỡ đầu của AI", giáo sư Stanford và CEO của World Labs, Fei-Fei Li.
CEO và đồng sáng lập của Trajectory, Ronak Malde, trước đây là nhà nghiên cứu AI tại Windsurf, và sau đó trở thành một trong số ít nhân viên làm việc tại Google DeepMind khi công ty này mua lại các tài năng hàng đầu của công ty khởi nghiệp mã hóa trong một thỏa thuận trị giá 2,4 tỷ USD vào năm ngoái. Các đồng sáng lập khác của Trajectory bao gồm Arjun Karanam, cựu nhà nghiên cứu AI tại Apple, người đã làm việc trên Vision Pro, và Michael Elabd, người trước đây làm việc trong bộ phận robot của Google DeepMind.
Malde chia sẻ với WIRED rằng một số sản phẩm mã hóa AI hàng đầu, như Cursor, đã thực hiện một phiên bản ban đầu của học tập liên tục – sử dụng dữ liệu thực tế về cách mọi người tương tác với sản phẩm của họ để thực hiện hậu đào tạo và thường xuyên cải thiện mô hình. Ông lập luận rằng đây là lý do cốt lõi khiến các sản phẩm mã hóa AI phát triển nhanh chóng, và là một phần lý do tại sao các phòng thí nghiệm AI lớn đã vội vã phát triển các ứng dụng mã hóa cảm xúc (vibe coding) của riêng họ. Với Trajectory, Malde và đội ngũ 11 nhà nghiên cứu và kỹ sư của mình hy vọng sẽ áp dụng một kỹ thuật tương tự để cải thiện các công cụ hỗ trợ AI bên ngoài lĩnh vực mã hóa.
Malde cho biết: “Ngay cả AI mạnh nhất hiện nay vẫn còn tĩnh. Mô hình AI mà bạn đã sử dụng ngày hôm qua sẽ mắc những lỗi tương tự ngày hôm nay. Một vài công ty đang bắt đầu tiến tới thế giới học tập liên tục. Điều chúng tôi đang làm là xây dựng nền tảng để mọi công ty đều có thể đạt được khả năng học tập liên tục.”
Việc áp dụng logic này vào các lĩnh vực khác gặp khó khăn do mã hóa dễ xác minh – mã hoặc chạy hoặc không – nhưng một số ngành công nghiệp có định nghĩa lỏng lẻo hơn về thành công. Karanam cho biết một phần dịch vụ của nền tảng Trajectory là giúp tối ưu hóa mô hình AI theo nhu cầu cụ thể của doanh nghiệp.
Thay vì bắt đầu với một mô hình có sẵn từ OpenAI hoặc Anthropic, Trajectory yêu cầu khách hàng bắt đầu với một mô hình mã nguồn mở đã được huấn luyện sau cho một sản phẩm AI cụ thể mà công ty đang hướng tới. Đối với Decagon, một khách hàng xây dựng các tác nhân hỗ trợ khách hàng AI, Trajectory ghi lại khi AI của họ gặp lỗi – ví dụ, một khách hàng cố gắng trả hàng nhưng yêu cầu của họ bị chuyển đến con người – và sử dụng những trường hợp đó để huấn luyện lại một mô hình mới thường xuyên hàng tuần. Trajectory tuyên bố các mô hình được huấn luyện sau này vượt trội so với các mô hình của các phòng thí nghiệm tiên phong trong các tác vụ hẹp quan trọng nhất đối với sản phẩm của một công ty.
Các giám đốc điều hành doanh nghiệp mong muốn sử dụng AI cho nhiều loại tác vụ khác nhau, nhưng để làm được điều đó hiện nay, họ thường cần thuê các nhóm "kỹ sư triển khai tiền tuyến", hoặc các chuyên gia tư vấn và nhân viên kỹ thuật được nhúng vào trong công ty để giúp xây dựng các sản phẩm AI. Các công ty như OpenAI, Anthropic và Palantir đã nhanh chóng đáp ứng nhu cầu đó. Elabd cho biết mục tiêu của Trajectory là xây dựng một sản phẩm có thể tự cải thiện để các công ty không cần kỹ sư nội bộ để liên tục khắc phục sự cố ngăn xếp AI của họ. Công ty khởi nghiệp này cho biết họ đã có khách hàng trong nhiều lĩnh vực khác nhau, bao gồm công ty khởi nghiệp bán hàng doanh nghiệp Clay và công ty khởi nghiệp AI pháp lý Harvey. Mặc dù hiện tại chủ yếu làm việc với các công ty bản địa AI, Trajectory cuối cùng có kế hoạch tiếp thị nền tảng của mình cho các công ty Fortune 500.
Các nhà phê bình có thể lập luận rằng Trajectory vẫn chưa xây dựng được khả năng học liên tục thực sự, ít nhất là không theo nghĩa truyền thống. Rốt cuộc, các mô hình của công ty khởi nghiệp này hiện chỉ cập nhật mỗi tuần một lần và chúng vẫn tĩnh giữa các lần nâng cấp.
Elabd lập luận rằng Trajectory chỉ mới bắt đầu. Ông tuyên bố ngành công nghiệp AI đang hướng tới một mô hình mới, nơi AI học hỏi từ kinh nghiệm – giống như những gì đã và đang xảy ra trong không gian mã hóa AI. Elabd cho biết mục tiêu cuối cùng của Trajectory là xây dựng một nền tảng có thể cập nhật mô hình AI của một công ty mỗi ngày, hoặc thậm chí thường xuyên hơn.
Elabd nói: “Mỗi ngày có thể không đủ. Có thể là mỗi giờ, có thể là mỗi tương tác. Có thể mỗi công ty không chỉ cần một AI, bạn có thể huấn luyện một AI để học hỏi cho mỗi người ở mỗi công ty.”
Đây là một ấn bản của bản tin Model Behavior của Maxwell Zeff. Đọc các bản tin trước đây tại đây.

Nguồn tin: Wired AI — Tác giả: Maxwell Zeff. Bản dịch tiếng Việt do AI thực hiện, có thể có sai sót.