Mọi tác nhân AI đều cần một công cụ tìm kiếm – Dưới đây là ba công cụ miễn phí thực sự hiệu quả
Nếu bạn xây dựng các tác nhân AI vào năm 2026, mô hình của bạn sẽ rất xuất sắc trong việc suy luận dựa trên văn bản nhưng lại vô dụng trong việc nắm bắt những gì đã xảy ra ngày hôm qua. Giải pháp mà mọi framework – CrewAI, LangGraph, AutoGPT, Aider, mọi máy chủ MCP có công cụ “tìm kiếm web” – cuối cùng đều đi đến là: cung cấp cho tác nhân một API tìm kiếm.
API tìm kiếm chính thức của Google bị khóa sau các hợp đồng doanh nghiệp. API tìm kiếm của Bing đang bị ngừng hoạt động. SerpAPI có giá khởi điểm 75 USD/tháng. Đối với các nhà phát triển đang thử nghiệm hoặc vận hành các tác nhân cá nhân, lựa chọn miễn phí thực tế là...
Mọi tác nhân AI đều cần một công cụ tìm kiếm — Dưới đây là ba công cụ miễn phí thực sự hiệu quả
Nếu bạn xây dựng các tác nhân AI vào năm 2026, mô hình của bạn sẽ rất xuất sắc trong việc suy luận dựa trên văn bản nhưng lại vô dụng trong việc nắm bắt những gì đã xảy ra ngày hôm qua. Giải pháp là một trong những giải pháp mà mọi framework — CrewAI, LangGraph, AutoGPT, Aider, mọi máy chủ MCP có công cụ "tìm kiếm web" — cuối cùng đều đạt được: cung cấp cho tác nhân một API tìm kiếm.
API tìm kiếm chính thức của Google bị khóa sau các hợp đồng doanh nghiệp. API tìm kiếm của Bing đang bị ngừng hoạt động. SerpAPI có giá khởi điểm 75 USD/tháng. Đối với các nhà phát triển đang thử nghiệm hoặc vận hành các tác nhân cá nhân, các tùy chọn miễn phí thực tế đã thu hẹp xuống còn ba nhà cung cấp đáng tin cậy, mỗi nhà cung cấp có một định nghĩa khác nhau về "miễn phí":
Tavily — được xây dựng chuyên biệt cho việc truy xuất LLM, 1.000 tín dụng API miễn phí mỗi tháng, không yêu cầu thẻ tín dụng.
Brave Search API — chỉ mục web độc lập, 2.000 truy vấn miễn phí mỗi tháng với tốc độ 1 truy vấn/giây, không yêu cầu thẻ tín dụng.
Exa — công cụ tìm kiếm thần kinh được thiết kế cho AI, 10 USD tín dụng đăng ký miễn phí (≈1.000 lượt tìm kiếm), chỉ đăng ký bằng email.
Cả ba đều sẵn sàng cho sản xuất, cả ba đều công bố thông số kỹ thuật OpenAPI mà bạn có thể dán vào định nghĩa công cụ và cả ba đều tích hợp trực tiếp vào các framework tác nhân mà bạn đang sử dụng. Hướng dẫn này phân tích những gì mỗi cấp độ miễn phí thực sự mang lại cho bạn, cấp độ nào nên kết hợp với framework nào và các trường hợp đặc biệt mà bạn nên sử dụng một công cụ hoàn toàn khác.
So sánh nhanh: Các cấp độ miễn phí của Tavily so với Brave so với Exa
Tính năng
Tavily (Miễn phí)
Brave Search API (Miễn phí)
Exa (Miễn phí)
Hạn mức miễn phí
1.000 tín dụng API/tháng
2.000 truy vấn/tháng
10 USD tín dụng đăng ký (~1.000 lượt tìm kiếm)
Giới hạn tốc độ
~10 yêu cầu/giây, không giới hạn hàng ngày
1 truy vấn/giây
~5 yêu cầu/giây
Cần thẻ tín dụng
Không
Không
Không
Đặt lại hạn mức miễn phí
Hàng tháng
Hàng tháng
Tín dụng một lần
Loại chỉ mục
Tổng hợp (Bing/khác) + thu thập riêng
Thu thập độc lập, chỉ mục riêng
Chỉ mục thần kinh dựa trên nhúng
Tối ưu hóa cho
Truy xuất RAG/tác nhân LLM
Tìm kiếm web truyền thống
Tìm kiếm ngữ nghĩa/tương đồng
Trích xuất nội dung
Có — tích hợp include_raw_content
Chỉ đoạn trích (cấp độ trả phí bổ sung trích xuất)
Có — tích hợp contents.text
Điểm cuối tin tức
Có (topic="news")
Có (API tin tức chuyên dụng)
Có (qua type="neural" + bộ lọc)
Bao gồm/loại trừ miền
Có
Hạn chế (goggles)
Có
Tốt nhất cho
Các tác nhân RAG cần văn bản sạch
Tìm kiếm số lượng lớn, giá rẻ ở quy mô lớn
Tìm các trang tương tự/nghiên cứu
Tóm tắt: Tavily là lựa chọn khi một LLM sẽ đọc kết quả; Brave là lựa chọn khi bạn muốn nhiều kết quả tìm kiếm độc lập với chi phí thấp; Exa là lựa chọn khi bạn muốn các kết quả có ý nghĩa ngữ nghĩa tương đồng chứ không chỉ từ khóa.
Tavily là gì?
Tavily là một API tìm kiếm được xây dựng đặc biệt cho LLM và các tác nhân AI. Được thành lập vào năm 2023 và hiện được hàng chục nghìn nhà phát triển sử dụng, nó đã trở thành công cụ tìm kiếm mặc định trong LangChain, công cụ được khuyến nghị trong tài liệu CrewAI và là ví dụ mà hầu hết các máy chủ tìm kiếm MCP đều tích hợp.
Điểm nổi bật rất đơn giản: một API tìm kiếm thông thường cung cấp cho bạn mười liên kết màu xanh và đoạn trích. Một tác nhân sau đó phải dành thêm lượt để truy cập từng URL, phân tích cú pháp HTML, loại bỏ quảng cáo và điều hướng, và tạo ra văn bản có thể sử dụng được. Tavily rút gọn toàn bộ quy trình đó thành một lệnh gọi API duy nhất — bạn gửi một truy vấn, bạn nhận lại các URL được xếp hạng cùng với một câu trả lời văn bản sạch, sẵn sàng cho mô hình được trích xuất từ các kết quả hàng đầu, với nội dung thô tùy chọn của mỗi trang.
Đối với các tác nhân (agents), điều này có ý nghĩa thực tiễn theo hai cách. Thứ nhất, nó giảm mức sử dụng token: thay vì đưa 10 trang HTML nhiễu vào cửa sổ ngữ cảnh, bạn đưa một bản tóm tắt đã được làm sạch cộng với ba đoạn trích đã được trích xuất. Thứ hai, nó giảm độ trễ: một lệnh gọi HTTP thay vì một lệnh gọi tìm kiếm cộng với mười lệnh gọi tìm nạp.
Tavily Free Tier: Những gì bạn thực sự nhận được
Gói miễn phí khá hào phóng cho việc tạo mẫu và các tác nhân cá nhân:
1.000 tín dụng API mỗi tháng, được làm mới vào đầu mỗi tháng dương lịch.
1 tín dụng = 1 tìm kiếm cơ bản; search_depth="advanced" tốn 2 tín dụng mỗi lần gọi.
Không yêu cầu thẻ tín dụng — đăng ký bằng email hoặc GitHub và khóa của bạn sẽ hoạt động ngay lập tức.
Truy cập API đầy đủ — mọi điểm cuối và tham số mà người dùng trả phí nhận được.
Giới hạn tốc độ khoảng 10 yêu cầu mỗi giây (không được công bố chính thức, nhưng nhất quán trong thực tế).
Đối với một tác nhân nghiệp dư thực hiện 30 tìm kiếm mỗi ngày, bạn sẽ không đạt đến giới hạn. Đối với một ứng dụng sản xuất, gói trả phí tiếp theo (Researcher) có giá 30 USD/tháng cho 4.000 tín dụng, với thanh toán dựa trên mức sử dụng bổ sung.
Một điều cần biết: Tavily không tự chạy trình thu thập dữ liệu (crawler) ở quy mô của Google. Nó tổng hợp từ các nhà cung cấp thượng nguồn (API của Bing là một nhà cung cấp chính) cộng với một trình thu thập dữ liệu được tuyển chọn từ các nguồn chất lượng cao, sau đó sắp xếp lại các kết quả kết hợp để phù hợp với truy vấn LLM cụ thể của bạn. Chất lượng xếp hạng là sản phẩm thực sự, không phải kích thước chỉ mục thô.
Bắt đầu với Tavily
1. Lấy khóa API miễn phí của bạn
Truy cập tavily.com và nhấp vào Get API Key.
Đăng nhập bằng GitHub hoặc email — không có biểu mẫu thẻ tín dụng nào xuất hiện.
Sao chép khóa từ bảng điều khiển của bạn (nó bắt đầu bằng tvly-).
2. Gọi API từ Python
pip install tavily-python
from tavily import TavilyClient
client = TavilyClient(api_key="tvly-YOUR_KEY")
response = client.search(
query="What were the major Claude 4.7 release notes?",
search_depth="basic", # "advanced" gives deeper crawl, costs 2 credits
max_results=5,
include_answer=True, # LLM-generated summary of top results
include_raw_content=False, # set True to get full extracted page text
)
print(response["answer"])
for r in response["results"]:
print(f"{r['title']} - {r['url']}")
print(r["content"][:200])
3. Lệnh curl trực tiếp không cần SDK
curl -X POST https://api.tavily.com/search \
-H "Content-Type: application/json" \
-d '{
"api_key": "tvly-YOUR_KEY",
"query": "latest open-source LLM benchmarks",
"search_depth": "basic",
"include_answer": true,
"max_results": 5
}'
4. Thêm Tavily vào một tác nhân CrewAI
from crewai import Agent
from crewai_tools import TavilySearchTool
researcher = Agent(
role="Research Analyst",
goal="Find authoritative sources for any topic",
backstory="You search the open web and cite primary sources only.",
tools=[Ta
Nguồn tin: Dev.to AI — Tác giả: toolfreebie. Bản dịch tiếng Việt do AI thực hiện, có thể có sai sót.