
Internet đang được tái cấu trúc cho các cỗ máy.
Khi các tác nhân AI (AI agent) chuyển từ giai đoạn thử nghiệm sang sản xuất, AWS, Cloudflare và các công ty khác đang thiết kế lại cơ sở hạ tầng đám mây nhằm hướng tới một tương lai mà lưu lượng truy cập internet chủ yếu do máy tạo ra, thay vì người dùng là con người.
Cơ sở hạ tầng đám mây từ lâu đã được thiết kế xoay quanh con người, những người tìm kiếm, nhấp chuột, cuộn và truyền phát một cách ổn định và có thể dự đoán được. Các tác nhân AI (AI agents) hoạt động khác biệt. Chúng có thể tạo ra một làn sóng hoạt động mạnh mẽ, khởi tạo nhiều tác nhân phụ truy vấn hàng trăm cơ sở dữ liệu, tìm kiếm tài liệu và gọi API chỉ trong vài giây, sau đó biến mất nhanh chóng như khi chúng xuất hiện.
Dựa trên tiền đề đó, Amazon đang thiết kế lại một phần cốt lõi của cơ sở hạ tầng đám mây của mình. Hôm thứ Năm, AWS đã ra mắt thế hệ tiếp theo của OpenSearch Serverless, một cơ sở dữ liệu tìm kiếm và vector được quản lý hoàn toàn – về cơ bản là một hệ thống để lưu trữ và truy xuất thông tin ở quy mô lớn – được thiết kế đặc biệt cho các tác vụ của tác nhân. AWS cho biết hệ thống mới có thể mở rộng quy mô ngay lập tức khi các tác nhân kích hoạt tác vụ và thu nhỏ về 0 khi không hoạt động.
Việc ra mắt này phản ánh một nhận thức ngày càng tăng trong ngành công nghệ: Cơ sở hạ tầng ban đầu được thiết kế cho internet do con người điều khiển không còn hoạt động hiệu quả trong một thế giới ngày càng có nhiều tác nhân.
Mặc dù các tác nhân AI vẫn chiếm một phần tương đối nhỏ trong hoạt động internet, nhưng lưu lượng truy cập do máy tạo ra đã đáng kể và có xu hướng tăng lên. Cloudflare cho biết bot chiếm 31% tổng lưu lượng HTTP trong sáu tháng qua. Các trình thu thập thông tin AI, công cụ tìm kiếm và trợ lý chiếm khoảng một phần tư tổng số yêu cầu của bot trong giai đoạn đó.
Ông Lai Yi Ohlsen, Giám đốc sản phẩm cấp cao tại Cloudflare, chia sẻ với TechCrunch: “Lưu lượng truy cập không phải của con người sẽ vượt quá lưu lượng truy cập của con người vào khoảng nửa đầu năm 2027”.
Tại hội nghị nhà phát triển I/O của Google vào tuần trước, công ty cho biết người dùng sẽ có thể bắt đầu giao phó các tác vụ cho hệ thống AI, như nghiên cứu mua hàng, đặt chuyến đi, duyệt web và tương tác với các ứng dụng. Tuy nhiên, vấn đề không chỉ dừng lại ở các tác nhân AI tập trung vào người tiêu dùng. Các doanh nghiệp ngày càng triển khai các tác nhân nội bộ và cho khách hàng của họ, tạo ra các loại lưu lượng truy cập do máy tạo ra mới ở hậu trường.
Kết quả là, các nhà cung cấp dịch vụ đám mây và các công ty cơ sở hạ tầng đã phải đối mặt với việc làm thế nào để điều chỉnh các hệ thống được xây dựng cho con người sang một thế giới của các tác nhân liên tục và tự động truy xuất thông tin, gọi công cụ và tạo ra lưu lượng truy cập giữa các máy.
Đó là nơi OpenSearch Serverless mới của AWS phát huy tác dụng.
Bà Tia White, Tổng Giám đốc Dịch vụ Amazon OpenSearch, chia sẻ với TechCrunch: “Thời điểm rất rõ ràng. Các tác nhân đang chuyển từ giai đoạn thử nghiệm sang sản xuất và chúng tạo ra các mô hình lưu lượng truy cập mà cơ sở hạ tầng trước đây đơn giản là không được thiết kế cho. Chúng tăng đột biến mà không báo trước, chúng không hoạt động mà không thông báo, và doanh nghiệp cần tìm kiếm để theo kịp mà không phải trả tiền cho điện toán trống hoặc không hoạt động”.
Thay đổi kỹ thuật chính với thế hệ mới này là nó tách biệt điện toán khỏi lưu trữ, cho phép điện toán mở rộng quy mô trong vài giây để đáp ứng các đợt lưu lượng truy cập của tác nhân và thu nhỏ về 0, do đó khách hàng không phải trả tiền khi các tác nhân không hoạt động.
Bà White cho biết: “Trước đây, ngay cả trong phiên bản Serverless trước đây của chúng tôi, bạn phải có ít nhất một phiên bản hoạt động và chạy vì lưu trữ và điện toán được kết nối với nhau. Bạn không thể tự động mở rộng [điện toán] theo tốc độ bạn cần, vì vậy bạn luôn có điện toán không hoạt động được dành riêng cho khối lượng công việc của mình, cho dù bạn có sử dụng hay không”.
Hãy hình dung điều đó giống như việc bạn luôn phải trả tiền cho một chỗ đậu xe, ngay cả khi bạn không sử dụng nó. Với Serverless được nâng cấp của AWS, nó giống như việc trả tiền cho một chỗ đậu xe tính theo đồng hồ.
Khi ra mắt, OpenSearch Serverless sẽ tích hợp nguyên bản với các nền tảng phát triển AI như Vercel và Kiro, cho phép các nhà phát triển triển khai các hệ thống tìm kiếm và vector sẵn sàng sản xuất cho các tác nhân (agent) mà không cần quản lý cơ sở hạ tầng.
Sự thay đổi này đang nổi lên trong toàn ngành điện toán đám mây. Databricks và Snowflake đang định vị lại mình thành các hệ thống bộ nhớ và truy xuất AI cho dữ liệu doanh nghiệp. Microsoft đã triển khai các bản cập nhật cho Azure được thiết kế để xử lý các đợt bùng nổ tác nhân AI và chia sẻ bộ nhớ giữa các tác nhân. Cloudflare, tương tự như Amazon, tháng trước đã giới thiệu cơ sở hạ tầng nhằm cung cấp cho các tác nhân môi trường bền vững và khả năng mở rộng tức thì.
Càng nhiều công ty triển khai các tác nhân AI, áp lực tái thiết kế cơ sở hạ tầng xung quanh khối lượng công việc do máy tạo ra sẽ càng lớn, điều này đến lượt nó có thể làm cho các tác nhân rẻ hơn và dễ triển khai hơn ở quy mô lớn hơn.

Nguồn tin: TechCrunch AI — Tác giả: Rebecca Bellan. Bản dịch tiếng Việt do AI thực hiện, có thể có sai sót.