Trong quá trình thử nghiệm, tác nhân AI của bạn hoạt động rất tốt. Nhưng khi triển khai, một số vấn đề phát sinh. Một công cụ lặp vô tận, dường như không bao giờ học được. Một bước truy xuất trả về kết quả không mong muốn và chi phí tăng vọt. Bạn hoàn toàn không biết nguyên nhân. Đó chính là vấn đề về khả năng quan sát tác nhân (agent observability). Và nếu bạn đang xây dựng bằng các mô hình ngôn ngữ lớn (LLM), bạn cần phải giải quyết vấn đề này.
Bài viết Agent Observability with LangSmith, Langfuse, and Arize: A Hands-On Comparison (Khả năng quan sát tác nhân với LangSmith, Langfuse và Arize: So sánh thực tế) xuất hiện lần đầu trên Analytics Vidhya.
Quan sát tác nhân: So sánh LangSmith, Langfuse và Arize
Hội nghị AI tương lai nhất của Ấn Độ đã trở lại – Lớn hơn, Sắc nét hơn, Táo bạo hơn
d : h : m : s
Nhận thông tin chi tiết
Các khóa học miễn phí
Các khóa học miễn phí
Lộ trình học tập
Chương trình tăng tốc
Chương trình tăng tốc
Mới
Chương trình GenAI Pinnacle
GenAI Pinnacle Plus
Người tiên phong AI tác nhân
Mới
DeepSeek
Hội nghị thượng đỉnh DataHack 2025
DHS 2026
Các khóa học miễn phí
Đăng nhập
Chuyển chế độ
Đăng xuất
Chuẩn bị phỏng vấn
Sự nghiệp
GenAI
Kỹ thuật nhắc nhở
ChatGPT
LLM
Langchain
RAG
Tác nhân AI
Học máy
Học sâu
Công cụ GenAI
LLMOps
Python
NLP
SQL
Dự án AIML
Danh sách đọc
Lộ trình học tập của nhà phân tích dữ liệu
Cách trở thành nhà phân tích dữ liệu vào năm 2025: Lộ trình hoàn chỉnh
Lộ trình học tập Tableau
Lộ trình học tập toàn diện về Tableau vào năm 2025
Lộ trình học tập NLP
Lộ trình học tập NLP toàn diện 2025
Lộ trình học tập của nhà khoa học dữ liệu
Lộ trình học tập để trở thành nhà khoa học dữ liệu vào năm 2025
Lộ trình học tập của kỹ sư dữ liệu
Lộ trình từng bước để trở thành kỹ sư dữ liệu vào năm 2025
Lộ trình học tập MLOps
Lộ trình học tập MLOps toàn diện: Phiên bản 2025
Lộ trình học tập của kỹ sư AI
Lộ trình để trở thành kỹ sư AI vào năm 2025
Lộ trình học tập thị giác máy tính
Lộ trình học tập toàn diện để thành thạo thị giác máy tính vào năm 2025
Lộ trình học tập AI tạo sinh
Lộ trình tốt nhất để học AI tạo sinh vào năm 2025
Lộ trình AI tạo sinh cho doanh nghiệp
Lộ trình GenAI cho doanh nghiệp
Lộ trình LLM
Các mô hình ngôn ngữ lớn được giải mã: Lộ trình dành cho người mới bắt đầu
Lộ trình kỹ sư nhắc nhở
Lộ trình học tập để trở thành chuyên gia kỹ thuật nhắc nhở
Trang chủ
Tác nhân AI
Quan sát tác nhân với LangSmith, Langfuse và Arize: So sánh thực tế
Quan sát tác nhân với LangSmith, Langfuse và Arize: So sánh thực tế
Riya Bansal
Cập nhật lần cuối:
03 tháng 6 năm 2026
8 phút đọc
Tác nhân AI của bạn hoạt động tốt trong thử nghiệm. Sau đó, bạn triển khai nó và một cái gì đó hơi trục trặc. Một công cụ lặp vô tận, như thể nó không bao giờ học được. Một bước truy xuất trả về dữ liệu rác và chi phí tăng vọt. Bạn hoàn toàn không biết tại sao.
Đó là vấn đề quan sát tác nhân. Và nếu bạn đang xây dựng với các mô hình ngôn ngữ lớn (LLM), bạn cần giải quyết nó trước khi sản xuất, không phải sau đó. Bài viết này sẽ phân tích ba công cụ quan sát được sử dụng nhiều nhất: LangSmith, Langfuse và Arize. Chúng ta sẽ thiết lập từng công cụ, theo dõi cùng một tác nhân và so sánh những gì bạn thực sự nhận được.
Mục lục
Quan sát tác nhân là gì?
Thiết lập tác nhân thử nghiệm
LangSmith: Theo dõi Langchain gốc
Langfuse: Mã nguồn mở và không phụ thuộc vào framework
Arize: Quan sát học máy cấp độ sản xuất
Bạn nên chọn công cụ nào để quan sát tác nhân?
Kết luận
Quan sát tác nhân là gì?
Giám sát ứng dụng truyền thống theo dõi các yêu cầu, lỗi và độ trễ, nhưng điều đó không đủ cho các tác nhân.
Một tác nhân có thể gọi nhiều công cụ theo trình tự, với mỗi bước LLM có lời nhắc, mức sử dụng token, độ trễ và điểm lỗi tiềm ẩn riêng. Một truy xuất hoặc cuộc gọi công cụ không thành công có thể dẫn đến phản hồi cuối cùng không chính xác.
Khả năng quan sát của tác nhân (agent observability) ghi lại toàn bộ biểu đồ thực thi: mọi bước, quyết định, đầu vào và đầu ra của LLM, lệnh gọi công cụ, đối số, kết quả, mức sử dụng token, độ trễ và điểm đánh giá. Nếu không có khả năng hiển thị này, việc gỡ lỗi hành vi của tác nhân sẽ trở thành phỏng đoán.
Thiết lập tác nhân thử nghiệm
Chúng tôi sẽ sử dụng một tác nhân LangChain rất đơn giản để so sánh chúng. Tác nhân nhận một câu hỏi từ người dùng, truy xuất ngữ cảnh liên quan và phản hồi bằng cách sử dụng một hoặc nhiều công cụ để đưa ra câu trả lời.
Đầu tiên, bạn cần tạo tác nhân thử nghiệm và cài đặt tất cả các thư viện cần thiết.
Hãy xem xét tác nhân cơ sở với hai phương thức (search_docs và get_order_status). Đây sẽ là nền tảng cơ bản của chúng tôi để so sánh với ba công cụ quan sát.
"""
Tác nhân cơ sở được sử dụng trong cả ba bản demo quan sát.
Hoán đổi biến môi trường OPENAI_API_KEY hoặc gọi build_agent() từ bất kỳ tệp demo nào.
"""
import os
from dotenv import load_dotenv
from langchain.agents import AgentExecutor, create_openai_tools_agent
from langchain.tools import tool
from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder
from langchain_openai import ChatOpenAI
load_dotenv()
@tool
def search_docs(query: str) -> str:
"""Tìm kiếm tài liệu nội bộ để biết thông tin liên quan."""
# Truy xuất mô phỏng — hoán đổi với kho vector thực tế của bạn
docs = {
"refund": (
"Hoàn tiền được xử lý trong vòng 5-7 ngày làm việc. "
"Các mặt hàng phải được trả lại trong vòng 30 ngày."
),
"shipping": (
"Vận chuyển tiêu chuẩn mất 3-5 ngày làm việc. "
"Chuyển phát nhanh là 1-2 ngày."
),
"account": (
"Bạn có thể đặt lại mật khẩu của mình qua trang đăng nhập. "
"Liên hệ hỗ trợ để biết các vấn đề về tài khoản."
),
}
for keyword, content in docs.items():
if keyword in query.lower():
return content
return f"Tìm thấy tài liệu chung liên quan đến: {query}"
@tool
def get_order_status(order_id: str) -> str:
"""Tra cứu trạng thái của một đơn hàng theo ID."""
# Tra cứu đơn hàng mô phỏng
statuses = {
"ORD-001": "Đã vận chuyển — dự kiến giao hàng 30/5/2026",
"ORD-002": "Đang xử lý — chưa vận chuyển",
"ORD-003": "Đã giao vào 25/5/2026",
}
return statuses.get(
order_id,
f"Không tìm thấy đơn hàng {order_id} trong hệ thống.",
)
def build_agent() -> AgentExecutor:
llm = ChatOpenAI(
model="gpt-4o",
temperature=0,
api_key=os.environ["OPENAI_API_KEY"],
)
tools = [search_docs, get_order_status]
prompt = ChatPromptTemplate.from_messages(
[
(
"system",
"Bạn là một trợ lý hỗ trợ khách hàng hữu ích. "
"Sử dụng các công cụ khi cần thiết.",
),
("user", "{input}"),
MessagesPlaceholder(variable_name="agent_scratchpad"),
]
)
agent = create_openai_tools_agent(
Nguồn tin: Analytics Vidhya — Tác giả: Riya Bansal. Bản dịch tiếng Việt do AI thực hiện, có thể có sai sót.