Bạn đã từng nghe những thuật ngữ AI này và gật đầu đồng tình…

Sự phát triển của trí tuệ nhân tạo (AI) đã kéo theo vô số thuật ngữ và tiếng lóng mới. Dưới đây là bảng chú giải với định nghĩa của một số từ và cụm từ quan trọng nhất mà bạn có thể gặp.

Trí tuệ nhân tạo (AI) đang thay đổi thế giới và đồng thời tạo ra một ngôn ngữ hoàn toàn mới để mô tả cách thức hoạt động của nó. Chỉ cần dành năm phút đọc về AI, bạn sẽ bắt gặp các thuật ngữ như LLM, RAG, RLHF và hàng tá thuật ngữ khác có thể khiến ngay cả những người rất thông minh trong giới công nghệ cũng cảm thấy bối rối. Bảng chú giải này là nỗ lực của chúng tôi nhằm khắc phục điều đó. Chúng tôi cập nhật thường xuyên khi lĩnh vực này phát triển, vì vậy hãy coi đây là một tài liệu sống, giống như các hệ thống AI mà nó mô tả. AGI Trí tuệ nhân tạo tổng quát, hay AGI, là một thuật ngữ mơ hồ. Tuy nhiên, nó thường đề cập đến AI có khả năng vượt trội hơn con người bình thường trong nhiều, nếu không muốn nói là hầu hết, các tác vụ. Giám đốc điều hành OpenAI Sam Altman từng mô tả AGI là “tương đương với một người bình thường mà bạn có thể thuê làm đồng nghiệp”. Trong khi đó, điều lệ của OpenAI định nghĩa AGI là “các hệ thống tự chủ cao có khả năng vượt trội hơn con người trong hầu hết các công việc có giá trị kinh tế”. Cách hiểu của Google DeepMind hơi khác so với hai định nghĩa này; phòng thí nghiệm này xem AGI là “AI có khả năng ít nhất ngang bằng con người trong hầu hết các tác vụ nhận thức”. Bối rối? Đừng lo lắng – ngay cả các chuyên gia hàng đầu trong nghiên cứu AI cũng vậy. Tác nhân AI Tác nhân AI đề cập đến một công cụ sử dụng công nghệ AI để thực hiện một loạt tác vụ thay mặt bạn – vượt xa những gì một chatbot AI cơ bản hơn có thể làm – chẳng hạn như nộp chi phí, đặt vé hoặc đặt bàn tại nhà hàng, hoặc thậm chí viết và duy trì mã. Tuy nhiên, như chúng tôi đã giải thích trước đây, có rất nhiều yếu tố đang thay đổi trong không gian mới nổi này, vì vậy “tác nhân AI” có thể có ý nghĩa khác nhau đối với những người khác nhau. Cơ sở hạ tầng cũng vẫn đang được xây dựng để đáp ứng các khả năng được hình dung. Nhưng khái niệm cơ bản ngụ ý một hệ thống tự chủ có thể dựa vào nhiều hệ thống AI để thực hiện các tác vụ đa bước. Điểm cuối API Hãy hình dung các điểm cuối API như những “nút bấm” ở phía sau một phần mềm mà các chương trình khác có thể nhấn để khiến nó thực hiện các tác vụ. Các nhà phát triển sử dụng các giao diện này để xây dựng các tích hợp – ví dụ, cho phép một ứng dụng lấy dữ liệu từ một ứng dụng khác, hoặc cho phép một tác nhân AI điều khiển trực tiếp các dịch vụ của bên thứ ba mà không cần con người vận hành thủ công từng giao diện. Hầu hết các thiết bị nhà thông minh và nền tảng được kết nối đều có các nút ẩn này, ngay cả khi người dùng thông thường không bao giờ nhìn thấy hoặc tương tác với chúng. Khi các tác nhân AI ngày càng có khả năng hơn, chúng ngày càng có thể tự tìm và sử dụng các điểm cuối này, mở ra những khả năng mạnh mẽ – và đôi khi bất ngờ – cho tự động hóa. Chuỗi suy nghĩ Khi được hỏi một câu hỏi đơn giản, bộ não con người có thể trả lời mà không cần suy nghĩ quá nhiều – những câu hỏi như “con vật nào cao hơn, hươu cao cổ hay mèo?”. Nhưng trong nhiều trường hợp, bạn thường cần bút và giấy để đưa ra câu trả lời đúng vì có các bước trung gian. Ví dụ, nếu một nông dân có gà và bò, và tổng cộng chúng có 40 cái đầu và 120 cái chân, bạn có thể cần viết ra một phương trình đơn giản để tìm ra câu trả lời (20 con gà và 20 con bò). Trong bối cảnh AI, lập luận chuỗi suy nghĩ cho các mô hình ngôn ngữ lớn có nghĩa là chia nhỏ một vấn đề thành các bước trung gian nhỏ hơn để cải thiện chất lượng của kết quả cuối cùng. Việc này thường mất nhiều thời gian hơn để có được câu trả lời, nhưng câu trả lời có nhiều khả năng chính xác hơn, đặc biệt trong bối cảnh logic hoặc mã hóa. Các mô hình lập luận được phát triển từ các mô hình ngôn ngữ lớn truyền thống và được tối ưu hóa cho tư duy chuỗi suy nghĩ nhờ học tăng cường. (Xem: Mô hình ngôn ngữ lớn) Tác nhân mã hóa Đây là một khái niệm cụ thể hơn so với "AI agent" (tác nhân AI), vốn là một chương trình có khả năng tự thực hiện các hành động, từng bước một, để hoàn thành một mục tiêu. Một coding agent (tác nhân lập trình) là một phiên bản chuyên biệt được áp dụng trong phát triển phần mềm. Thay vì chỉ đề xuất mã để con người xem xét và dán vào, một coding agent có thể tự động viết, kiểm tra và gỡ lỗi mã, xử lý các công việc lặp đi lặp lại, thử và sai mà thông thường chiếm phần lớn thời gian của một nhà phát triển. Các tác nhân này có thể hoạt động trên toàn bộ các codebase (cơ sở mã), phát hiện lỗi, chạy thử nghiệm và đẩy các bản sửa lỗi với sự giám sát tối thiểu của con người. Có thể hình dung điều này giống như thuê một thực tập sinh rất nhanh nhẹn, không bao giờ ngủ và không bao giờ mất tập trung — mặc dù, giống như bất kỳ thực tập sinh nào, con người vẫn cần xem xét công việc. Compute (Tính toán) Mặc dù là một thuật ngữ đa nghĩa, compute thường đề cập đến sức mạnh tính toán quan trọng cho phép các mô hình AI hoạt động. Loại xử lý này thúc đẩy ngành công nghiệp AI, mang lại khả năng đào tạo và triển khai các mô hình mạnh mẽ của nó. Thuật ngữ này thường là cách viết tắt cho các loại phần cứng cung cấp sức mạnh tính toán — như GPU, CPU, TPU và các dạng cơ sở hạ tầng khác tạo thành nền tảng của ngành công nghiệp AI hiện đại. Deep learning (Học sâu) Một tập hợp con của học máy tự cải tiến, trong đó các thuật toán AI được thiết kế với cấu trúc mạng nơ-ron nhân tạo (ANN) đa lớp. Điều này cho phép chúng tạo ra các mối tương quan phức tạp hơn so với các hệ thống dựa trên học máy đơn giản hơn, như mô hình tuyến tính hoặc cây quyết định. Cấu trúc của các thuật toán học sâu lấy cảm hứng từ các đường dẫn kết nối của các nơ-ron trong não người. Các mô hình AI học sâu có khả năng tự xác định các đặc điểm quan trọng trong dữ liệu, thay vì yêu cầu các kỹ sư con người phải định nghĩa các đặc điểm này. Cấu trúc này cũng hỗ trợ các thuật toán có thể học hỏi từ các lỗi và, thông qua quá trình lặp lại và điều chỉnh, cải thiện đầu ra của chính chúng. Tuy nhiên, các hệ thống học sâu yêu cầu rất nhiều điểm dữ liệu để mang lại kết quả tốt (hàng triệu hoặc hơn). Chúng cũng thường mất nhiều thời gian hơn để đào tạo so với các thuật toán học máy đơn giản hơn — do đó chi phí phát triển có xu hướng cao hơn. (Xem: Neural network - Mạng nơ-ron) Diffusion (Khuếch tán) Diffusion là công nghệ cốt lõi của nhiều mô hình AI tạo ra nghệ thuật, âm nhạc và văn bản. Lấy cảm hứng từ vật lý, các hệ thống diffusion từ từ "phá hủy" cấu trúc của dữ liệu — ví dụ: ảnh, bài hát, v.v. — bằng cách thêm nhiễu cho đến khi không còn gì. Trong vật lý, khuếch tán là tự phát và không thể đảo ngược.

Bạn đã từng nghe những thuật ngữ AI này và gật đầu đồng tình; hãy cùng làm rõ chúng.