Một tiêu chuẩn để xây dựng các tác nhân AI sản xuất (+ kỹ năng Claude Code có thể cài đặt)
URL bài viết: https://github.com/AlexDuchDev/agentic-product-standard URL bình luận: https://news.ycombinator.com/item?id=48343169 Điểm: 1 Bình luận: 0
Tiêu chuẩn Sản phẩm Tác nhân (Agentic Product Standard)
Một tiêu chuẩn chính tắc để xây dựng các sản phẩm tác nhân cấp độ sản xuất – cùng với bộ kỹ năng Claude Code giúp vận hành tiêu chuẩn này.
Được chắt lọc từ các phương pháp sản xuất của Anthropic, OpenAI, Cognition, Sierra, LangChain và các chuyên gia hàng đầu – giai đoạn 2024–2026.
Đọc Tiêu chuẩn → · Cài đặt Kỹ năng → · Triển khai Tham chiếu ↗ · Danh sách Kiểm tra Quyết định →
Một sản phẩm tác nhân không phải là "một sản phẩm có AI".
Đó là một sản phẩm mà một phần của quy trình được điều khiển động bởi một LLM (mô hình ngôn ngữ lớn) trong một kiến trúc xác định với các ranh giới tin cậy rõ ràng.
Hầu hết các nhóm chỉ xuất bản các bản demo tác nhân. Rất ít tác nhân có thể tồn tại khi tiếp xúc với môi trường sản xuất. Sự khác biệt hầu như không bao giờ nằm ở mô hình – mà là ở kiến trúc, bộ khung (harness) và kỷ luật đánh giá xung quanh nó. Kho lưu trữ này là tiêu chuẩn đã được thử nghiệm thực tế cho công việc đó, cùng với một bộ kỹ năng Claude Code đưa nó vào trình chỉnh sửa của bạn.
Mục lục
Lý do tồn tại
Năm nguyên tắc
Nội dung trong kho lưu trữ này
Triển khai tham chiếu
Cài đặt kỹ năng
Thang đo tự chủ (Autonomy Ladder)
Năm mẫu hình kết hợp
Bộ khung 7 lớp
Danh sách kiểm tra 10 câu hỏi
Sẵn sàng sản xuất – Định nghĩa Hoàn thành
Các mẫu hình phản tác dụng
Danh sách đọc
Đóng góp
Giấy phép
Lý do tồn tại
Năm nguyên tắc đã hội tụ độc lập trong các phương pháp sản xuất của các phòng thí nghiệm và các chuyên gia hàng đầu. Chúng là xương sống của mọi quyết định trong tiêu chuẩn này:
Năm nguyên tắc
#
Nguyên tắc
Ý nghĩa
1
Tính xác định theo mặc định, tính tác nhân khi cần thiết
Mọi mức độ tự chủ phải được giành lấy, không được cấp ngay từ đầu.
2
Kiến trúc vượt trội hơn khung công tác
Các mẫu hình tồn tại lâu hơn các thư viện.
3
Bộ khung > mô hình
98% độ tin cậy nằm trong mã xung quanh LLM.
4
Kỹ thuật ngữ cảnh là kỷ luật cốt lõi
Những gì đi vào cửa sổ ngữ cảnh quyết định mọi thứ.
5
Phát triển dựa trên đánh giá là không thể thương lượng
Không đo lường → không cải thiện. Không xem xét dấu vết → không hiểu.
Quy tắc quan trọng nhất: Kiến trúc là những gì còn lại khi mô hình được cải thiện. Mô hình là biến số, bộ khung là hằng số. Đầu tư tương xứng.
Nội dung trong kho lưu trữ này
agentic-product-standard/
├── STANDARD.md ← tiêu chuẩn cấp sản phẩm – thiết kế sản phẩm đa tác nhân
├── AGENT_STANDARD.md ← tiêu chuẩn vận hành tác nhân đơn – xây dựng một tác nhân
├── templates/ ← sao chép-dán các hợp đồng-tạo tác (hợp đồng, lược đồ, bao bọc, đánh giá)
├── examples/ ← ví dụ đã thực hiện: triển khai tham chiếu AgenticMind
└── skills/
├── agentic-product-architect/ ← kỹ năng: thiết kế & xuất bản SẢN PHẨM tác nhân (bộ định tuyến chính)
│ ├── SKILL.md ← chính: bộ định tuyến + triết lý
│ ├── architecture-design/ ← thang đo tự chủ, 5 mẫu hình, đơn tác nhân so với đa tác nhân
│ ├── context-engineering/ ← viết/chọn/nén/cô lập, quy tắc 40%
│ ├── harness-engineering/ ← 7 lớp xung quanh vòng lặp LLM
│ ├── tool-design-mcp/ ← MCP-first, <20 công cụ, RAG-MCP, sandboxing
│ ├── memory-architecture/ ← Mem0 / Zep / Letta / LangMem / files
│ ├── durable-execution/ ← mẫu hình Temporal Workflow + Activity
│ ├── eval-driven-dev/ ← kim tự tháp Husain/Shankar + hiệu chuẩn đánh giá
│ ├── framework-selection/ ← LangGraph / Claude SDK / OpenAI SDK / khác
│ ├── production-readiness/ ← kiểm toán Định nghĩa Hoàn thành 12 điểm
│ └── antipatterns-review/ ← xem xét mã thông qua 12 chế độ lỗi đã biết
└── agent-builder/ ← kỹ năng: xây dựng MỘT tác nhân cấp độ sản xuất
Hai lộ trình, một tiêu chuẩn:
Xây dựng một tác nhân → đọc AGENT_STANDARD.md, điền vào templates/, điều khiển nó bằng kỹ năng agent-builder.
Thiết kế một sản phẩm → đọc STANDARD.md, điều khiển sản phẩm bằng kỹ năng agentic-product-architect (đa tác nhân, điều phối, lựa chọn khung).
Tài liệu là tài liệu tham khảo; các kỹ năng là thực hành – chúng tự động tải hướng dẫn phù hợp trong khi bạn thiết kế, xây dựng và đánh giá. Cả hai kỹ năng đều có chung mười kỹ năng phụ.
Triển khai tham chiếu
AgenticMind là triển khai tham chiếu hàng đầu của tiêu chuẩn này – một lớp kiến thức & bộ nhớ có thể kiểm toán, tự cải thiện cho các tác nhân trên MCP (Apache-2.0, Postgres + pgvector, headless Bun). Nó đưa các lớp kiến trúc bộ nhớ, kỹ thuật ngữ cảnh, thiết kế công cụ/MCP, hiệu chuẩn đánh giá, thực thi bền vững và khả năng quan sát của tiêu chuẩn vào mã đang chạy, đã được kiểm thử.
Kho lưu trữ
Sử dụng khi
📐
agentic-product-standard (kho lưu trữ này)
Bạn đang thiết kế hoặc xây dựng một tác nhân/sản phẩm tác nhân – tiêu chuẩn + kỹ năng cho bạn biết cách thực hiện.
🧠
AgenticMind ↗
Bạn cần một lớp kiến thức & bộ nhớ cho tác nhân của mình – một triển khai hoạt động mà bạn có thể chạy.
→ Nghiên cứu điển hình AgenticMind theo từng lớp.
🚀 Cài đặt kỹ năng
Các kỹ năng hoạt động với Claude Code. Cài đặt cả hai nhánh (chúng chia sẻ các kỹ năng phụ).
Nhanh nhất – một lệnh (qua skills.sh):
npx skills add AlexDuchDev/agentic-product-standard
Hoặc sao chép thủ công – cấp người dùng (có sẵn trong mọi dự án):
git clone https://github.com/AlexDuchDev/agentic-product-standard.git
cp -R agentic-product-standard/skills/* ~/.claude/skills/
Cấp dự án (giới hạn trong một kho lưu trữ):
mkdir -p .claude/skills
cp -R /path/to/agentic-product-standard/skills/* .claude/skills/
Claude Code khám phá các kỹ năng thông qua mỗi SKILL.md và phần đầu YAML của nó. Sau khi cài đặt: agent-builder kích hoạt khi bạn bắt đầu xây dựng, triển khai hoặc đánh giá một tác nhân; agentic-product-architect kích hoạt cho các sản phẩm đa tác nhân, một vòng lặp tác nhân hoặc bất kỳ khung chính nào (LangGraph, CrewAI, OpenAI Agents SDK, Claude Agent SDK, Pydantic AI, AutoGen). Đặt một câu hỏi tập trung – "Mem0 hay Zep?", "tôi nên cấu trúc ngữ cảnh như thế nào?", "đánh giá mã tác nhân của tôi" – và kỹ năng phụ liên quan sẽ được tải trực tiếp.
Thang tự chủ
Không bao giờ bắt đầu với "xây dựng một tác nhân". Hãy bắt đầu với "nhiệm vụ này yêu cầu mức độ tự chủ tối thiểu nào?". Chi phí khi làm sai điều này là không đối xứng.
Cấp độ
Nó là gì
Sử dụng khi
L0 · Gọi LLM đơn lẻ
Một lời nhắc → một phản hồi
Phân loại, trích xuất, tóm tắt
L1 · LLM tăng cường
+ truy xuất, + công cụ, + bộ nhớ
Hỏi đáp trên tài liệu, trợ lý đơn giản
L2 · Quy trình làm việc
Mã xác định điều phối các bước LLM
Đường dẫn đã biết; tính dự đoán quan trọng
L3 · Điều phối viên-Người thực hiện
LLM phân tách trong một đồ thị giới hạn
Song song
Nguồn tin: Hacker News AI — Tác giả: AlexDuch. Bản dịch tiếng Việt do AI thực hiện, có thể có sai sót.