Cái bẫy AI chúng ta đang mắc phải

URL bài viết: https://unvoid.substack.com/p/the-ai-trap-were-walking-into URL bình luận: https://news.ycombinator.com/item?id=48375449 Điểm: 1 Bình luận: 0

Cái bẫy AI chúng ta đang mắc phải Token giá rẻ, sức mạnh đắt đỏ Unvoid Ngày 02/6/2026 Chia sẻ Chúng ta từng được hứa hẹn rằng trí tuệ nhân tạo sẽ dân chủ hóa công việc tri thức. Rằng một đứa trẻ với chiếc máy tính xách tay ở một thị trấn nhỏ sẽ có sức mạnh nhận thức tương đương một tập đoàn. Trong một khoảnh khắc ngắn ngủi, choáng váng, điều đó thậm chí còn có vẻ đúng. Tôi không còn chắc chắn nữa. Đây là câu chuyện tôi thấy đang diễn ra, và tại sao tôi nghĩ chúng ta sắp lặp lại một trong những sai lầm lâu đời nhất của nhân loại. Cảm ơn bạn đã đọc Signal in the Noise! Đăng ký miễn phí để nhận các bài viết mới và ủng hộ công việc của tôi. Đăng ký Các mô hình ngôn ngữ lớn (LLM) và tác nhân (agent) đang trở thành hàng hóa Hai năm trước, một mô hình ngôn ngữ có năng lực cảm giác như phép thuật. Ngày nay, nó giống như điện, thứ mà bạn cắm vào. Các con số thật đáng kinh ngạc: chi phí suy luận LLM cho hiệu suất tương đương đang giảm khoảng 10 lần mỗi năm, nhanh hơn tốc độ giảm của điện toán trong cuộc cách mạng máy tính cá nhân hoặc băng thông trong thời kỳ bùng nổ dotcom. Một khả năng có giá khoảng 20 USD cho mỗi triệu token vào cuối năm 2022 hiện có giá khoảng 0,40 USD, và các mô hình rẻ nhất đạt chất lượng GPT-3 ban đầu đã giảm 1.000 lần trong ba năm. (a16z, Introl) Các mô hình mã nguồn mở (open-weight models) cũng đang thu hẹp khoảng cách với các mô hình tiên tiến, chỉ kém các mô hình đóng tốt nhất khoảng bốn tháng trên các tiêu chuẩn chính. Khi khoảng cách nhỏ như vậy, khả năng thô không còn khan hiếm nữa. (Epoch AI) Đây là hình ảnh của sự hàng hóa hóa. Và bất cứ khi nào một công nghệ trở thành hàng hóa, câu hỏi thú vị không còn là "Bạn có thể làm được không?" mà trở thành "Bạn có đủ khả năng để làm điều đó ở quy mô lớn không?". Công việc của tác nhân ngày càng đắt đỏ, không hề rẻ hơn Đây là phần phản trực giác. Giá mỗi token tiếp tục giảm, nhưng chi phí cho công việc tác nhân có ý nghĩa lại tăng lên. Tại sao? Bởi vì các tác nhân không chỉ thực hiện một cuộc gọi. Chúng đọc một nhiệm vụ, nhận phản hồi, sau đó đọc lại mọi thứ trước hành động tiếp theo, sau đó đọc lại tất cả những điều đó cộng với phản hồi mới, tạo ra một "quả cầu tuyết" ngữ cảnh đắt đỏ. Một nghiên cứu của Stanford Digital Economy Lab cho thấy các tác vụ tác nhân "đắt đỏ một cách độc đáo, tiêu thụ lượng token gấp 1.000 lần so với suy luận mã và trò chuyện mã", với chi phí chủ yếu do các token đầu vào. Tệ hơn nữa, việc sử dụng đó cực kỳ khó đoán: các lần chạy trên cùng một tác vụ có thể khác nhau tới 30 lần về tổng số token, và việc đốt nhiều token hơn thậm chí không đảm bảo một câu trả lời tốt hơn. (Stanford Digital Economy Lab) Các mô hình suy luận đổ thêm dầu vào lửa. Chúng "suy nghĩ" trong các chuỗi token ẩn mà bạn vẫn phải trả tiền, tiêu thụ lượng token gấp năm đến hai mươi lần cho mỗi yêu cầu so với các mô hình tiêu chuẩn. Một truy vấn thường mất 700 token có thể tăng vọt lên 3.700 khi mô hình suy luận nội bộ. (Keito) Với khối lượng doanh nghiệp, một tác nhân hỗ trợ có vẻ rẻ với 100 token mỗi tương tác có thể lên tới 2.000 đến 5.000 khi các cuộc gọi công cụ và suy luận đa bước được kích hoạt, tạo ra "các hóa đơn token hàng tháng làm lu mờ cả chi phí cơ sở hạ tầng của bạn". (DataRobot) Giá đơn vị giảm trong khi tổng mức tiêu thụ bùng nổ. Đối với một người có sở thích, đó là một sai số làm tròn. Đối với một công ty điều hành hàng triệu quy trình làm việc tự động mỗi ngày, nó trở thành một khoản mục nghiêm trọng tăng theo tham vọng. Các nhà nghiên cứu cảnh báo rằng nếu không có sự đổi mới lớn ở cấp độ hệ thống, chi phí cho mỗi yêu cầu có thể tăng "theo cấp số nhân", khiến việc triển khai tác nhân quy mô lớn "không khả thi về mặt kinh tế và môi trường". (arXiv) Kết quả: công việc AI càng có giá trị, chi phí vận hành càng cao. Những người có ngân sách sẽ mua sức mạnh Nếu khả năng tác nhân (agentic capability) được định lượng, thì khả năng sẽ trở thành một hàm của vốn. Ai có thể đổ nhiều tiền nhất vào điện toán sẽ có được các tác nhân nhanh hơn và kỹ lưỡng hơn, nhiều thử nghiệm song song hơn, các mô hình tiên tiến nhất ngay khi chúng ra mắt, và sự xa xỉ khi không phải nghĩ đến chi phí. Đây là một mô hình quen thuộc. Vốn tập trung vào bất kỳ nguồn lực nào khan hiếm. Hôm qua là đất đai, nhà máy và dữ liệu. Ngày mai là ngân sách suy luận (inference budget). Các nhà nghiên cứu đã cảnh báo rằng AI có nguy cơ làm gia tăng bất bình đẳng thu nhập trừ khi chúng ta cố tình điều hướng nó theo hướng khác. (Brookings) Những người không có vốn phải làm việc thủ công Trong khi đó, những người khác làm những gì con người vẫn luôn làm khi họ không đủ khả năng mua máy móc: họ làm việc thủ công. Họ gắn nhãn, kiểm duyệt, sửa chữa và chú thích, lấp đầy những khoảng trống mà các mô hình giá rẻ không thể. Chúng ta đã có một cái tên cho phiên bản ban đầu của điều này: lực lượng lao động toàn cầu, thường vô hình, gắn nhãn dữ liệu và tinh chỉnh các mô hình với mức lương ít ỏi. Các cuộc điều tra đã ghi nhận công nhân Kenya đào tạo hệ thống AI với mức lương khoảng 2 USD/giờ trong điều kiện khắc nghiệt, hợp đồng được thiết kế để sa thải nhanh chóng và lao động không được trả lương. (Brookings, TechCrunch) Các nhà gắn nhãn dữ liệu Kenya sau đó đã tổ chức thành Hiệp hội Gắn nhãn Dữ liệu để phản đối. (Computer Weekly) Khi AI chiếm nhiều công việc trí óc hơn, lớp "con người trong vòng lặp" (human-in-the-loop) này không biến mất. Nó phát triển và trượt xuống chuỗi giá trị. Công việc thủ công trở thành nhiên liệu đào tạo Đây là vòng lặp khiến toàn bộ quá trình tự củng cố và thực sự khó chịu. Mỗi lần sửa chữa, mỗi nhãn, mỗi câu "AI làm sai rồi, để tôi sửa" đều là dữ liệu. Nó chảy ngược lên. Nó đào tạo mô hình tiếp theo. Công việc được thực hiện bởi những người không đủ khả năng mua mô hình tốt chính là thứ làm cho mô hình tốt trở nên tốt hơn. Nhưng nó còn đi xa hơn công việc sửa chữa được trả tiền, và đây là lúc nó trở nên cá nhân đối với bất kỳ ai xây dựng mọi thứ một cách công khai. Hãy nghĩ về nhà phát triển không sử dụng tác nhân AI nào cả, người đang ngồi xuống và viết mã thực sự mới, sáng tạo, giải quyết một vấn đề khó khăn và đẩy nó lên một kho lưu trữ mã nguồn mở công khai như một món quà cho cộng đồng. Đóng góp đó không còn là một món quà. Nó bị cạo, hấp thụ và biến thành dữ liệu đào tạo cho tác nhân mã hóa tiếp theo. Con người thực hiện công việc ban đầu, sáng tạo, chưa được giải quyết trước đây; mô hình hấp thụ nó và bán lại nó dưới dạng tự động hoàn thành. Phần quan trọng là hầu hết những điều này không được yêu cầu. GitHub Copilot, được xây dựng bởi GitHub, Microsoft và OpenAI, đã được đào tạo trên hàng tỷ dòng mã có sẵn công khai, và vào năm 2022, một vụ kiện tập thể (Doe kiện GitHub) đã cáo buộc các công ty vi phạm các điều khoản cấp phép mã nguồn mở, tước bỏ quyền sở hữu trí tuệ.