Một tiêu chuẩn để xây dựng các tác nhân AI sản xuất (+ kỹ năng…

URL bài viết: https://github.com/AlexDuchDev/agentic-product-standard URL bình luận: https://news.ycombinator.com/item?id=48343169 Điểm: 1 Bình luận: 0

Tiêu chuẩn Sản phẩm Tác nhân (Agentic Product Standard) Một tiêu chuẩn chính tắc để xây dựng các sản phẩm tác nhân cấp độ sản xuất – cùng với bộ kỹ năng Claude Code giúp vận hành tiêu chuẩn này. Được chắt lọc từ các phương pháp sản xuất của Anthropic, OpenAI, Cognition, Sierra, LangChain và các chuyên gia hàng đầu – giai đoạn 2024–2026. Đọc Tiêu chuẩn → · Cài đặt Kỹ năng → · Triển khai Tham chiếu ↗ · Danh sách Kiểm tra Quyết định → Một sản phẩm tác nhân không phải là "một sản phẩm có AI". Đó là một sản phẩm mà một phần của quy trình được điều khiển động bởi một LLM (mô hình ngôn ngữ lớn) trong một kiến trúc xác định với các ranh giới tin cậy rõ ràng. Hầu hết các nhóm chỉ xuất bản các bản demo tác nhân. Rất ít tác nhân có thể tồn tại khi tiếp xúc với môi trường sản xuất. Sự khác biệt hầu như không bao giờ nằm ở mô hình – mà là ở kiến trúc, bộ khung (harness) và kỷ luật đánh giá xung quanh nó. Kho lưu trữ này là tiêu chuẩn đã được thử nghiệm thực tế cho công việc đó, cùng với một bộ kỹ năng Claude Code đưa nó vào trình chỉnh sửa của bạn. Mục lục Lý do tồn tại Năm nguyên tắc Nội dung trong kho lưu trữ này Triển khai tham chiếu Cài đặt kỹ năng Thang đo tự chủ (Autonomy Ladder) Năm mẫu hình kết hợp Bộ khung 7 lớp Danh sách kiểm tra 10 câu hỏi Sẵn sàng sản xuất – Định nghĩa Hoàn thành Các mẫu hình phản tác dụng Danh sách đọc Đóng góp Giấy phép Lý do tồn tại Năm nguyên tắc đã hội tụ độc lập trong các phương pháp sản xuất của các phòng thí nghiệm và các chuyên gia hàng đầu. Chúng là xương sống của mọi quyết định trong tiêu chuẩn này: Năm nguyên tắc # Nguyên tắc Ý nghĩa 1 Tính xác định theo mặc định, tính tác nhân khi cần thiết Mọi mức độ tự chủ phải được giành lấy, không được cấp ngay từ đầu. 2 Kiến trúc vượt trội hơn khung công tác Các mẫu hình tồn tại lâu hơn các thư viện. 3 Bộ khung > mô hình 98% độ tin cậy nằm trong mã xung quanh LLM. 4 Kỹ thuật ngữ cảnh là kỷ luật cốt lõi Những gì đi vào cửa sổ ngữ cảnh quyết định mọi thứ. 5 Phát triển dựa trên đánh giá là không thể thương lượng Không đo lường → không cải thiện. Không xem xét dấu vết → không hiểu. Quy tắc quan trọng nhất: Kiến trúc là những gì còn lại khi mô hình được cải thiện. Mô hình là biến số, bộ khung là hằng số. Đầu tư tương xứng. Nội dung trong kho lưu trữ này agentic-product-standard/ ├── STANDARD.md ← tiêu chuẩn cấp sản phẩm – thiết kế sản phẩm đa tác nhân ├── AGENT_STANDARD.md ← tiêu chuẩn vận hành tác nhân đơn – xây dựng một tác nhân ├── templates/ ← sao chép-dán các hợp đồng-tạo tác (hợp đồng, lược đồ, bao bọc, đánh giá) ├── examples/ ← ví dụ đã thực hiện: triển khai tham chiếu AgenticMind └── skills/ ├── agentic-product-architect/ ← kỹ năng: thiết kế & xuất bản SẢN PHẨM tác nhân (bộ định tuyến chính) │ ├── SKILL.md ← chính: bộ định tuyến + triết lý │ ├── architecture-design/ ← thang đo tự chủ, 5 mẫu hình, đơn tác nhân so với đa tác nhân │ ├── context-engineering/ ← viết/chọn/nén/cô lập, quy tắc 40% │ ├── harness-engineering/ ← 7 lớp xung quanh vòng lặp LLM │ ├── tool-design-mcp/ ← MCP-first, <20 công cụ, RAG-MCP, sandboxing │ ├── memory-architecture/ ← Mem0 / Zep / Letta / LangMem / files │ ├── durable-execution/ ← mẫu hình Temporal Workflow + Activity │ ├── eval-driven-dev/ ← kim tự tháp Husain/Shankar + hiệu chuẩn đánh giá │ ├── framework-selection/ ← LangGraph / Claude SDK / OpenAI SDK / khác │ ├── production-readiness/ ← kiểm toán Định nghĩa Hoàn thành 12 điểm │ └── antipatterns-review/ ← xem xét mã thông qua 12 chế độ lỗi đã biết └── agent-builder/ ← kỹ năng: xây dựng MỘT tác nhân cấp độ sản xuất Hai lộ trình, một tiêu chuẩn: Xây dựng một tác nhân → đọc AGENT_STANDARD.md, điền vào templates/, điều khiển nó bằng kỹ năng agent-builder. Thiết kế một sản phẩm → đọc STANDARD.md, điều khiển sản phẩm bằng kỹ năng agentic-product-architect (đa tác nhân, điều phối, lựa chọn khung). Tài liệu là tài liệu tham khảo; các kỹ năng là thực hành – chúng tự động tải hướng dẫn phù hợp trong khi bạn thiết kế, xây dựng và đánh giá. Cả hai kỹ năng đều có chung mười kỹ năng phụ. Triển khai tham chiếu AgenticMind là triển khai tham chiếu hàng đầu của tiêu chuẩn này – một lớp kiến thức & bộ nhớ có thể kiểm toán, tự cải thiện cho các tác nhân trên MCP (Apache-2.0, Postgres + pgvector, headless Bun). Nó đưa các lớp kiến trúc bộ nhớ, kỹ thuật ngữ cảnh, thiết kế công cụ/MCP, hiệu chuẩn đánh giá, thực thi bền vững và khả năng quan sát của tiêu chuẩn vào mã đang chạy, đã được kiểm thử. Kho lưu trữ Sử dụng khi 📐 agentic-product-standard (kho lưu trữ này) Bạn đang thiết kế hoặc xây dựng một tác nhân/sản phẩm tác nhân – tiêu chuẩn + kỹ năng cho bạn biết cách thực hiện. 🧠 AgenticMind ↗ Bạn cần một lớp kiến thức & bộ nhớ cho tác nhân của mình – một triển khai hoạt động mà bạn có thể chạy. → Nghiên cứu điển hình AgenticMind theo từng lớp. 🚀 Cài đặt kỹ năng Các kỹ năng hoạt động với Claude Code. Cài đặt cả hai nhánh (chúng chia sẻ các kỹ năng phụ). Nhanh nhất – một lệnh (qua skills.sh): npx skills add AlexDuchDev/agentic-product-standard Hoặc sao chép thủ công – cấp người dùng (có sẵn trong mọi dự án): git clone https://github.com/AlexDuchDev/agentic-product-standard.git cp -R agentic-product-standard/skills/* ~/.claude/skills/ Cấp dự án (giới hạn trong một kho lưu trữ): mkdir -p .claude/skills cp -R /path/to/agentic-product-standard/skills/* .claude/skills/ Claude Code khám phá các kỹ năng thông qua mỗi SKILL.md và phần đầu YAML của nó. Sau khi cài đặt: agent-builder kích hoạt khi bạn bắt đầu xây dựng, triển khai hoặc đánh giá một tác nhân; agentic-product-architect kích hoạt cho các sản phẩm đa tác nhân, một vòng lặp tác nhân hoặc bất kỳ khung chính nào (LangGraph, CrewAI, OpenAI Agents SDK, Claude Agent SDK, Pydantic AI, AutoGen). Đặt một câu hỏi tập trung – "Mem0 hay Zep?", "tôi nên cấu trúc ngữ cảnh như thế nào?", "đánh giá mã tác nhân của tôi" – và kỹ năng phụ liên quan sẽ được tải trực tiếp. Thang tự chủ Không bao giờ bắt đầu với "xây dựng một tác nhân". Hãy bắt đầu với "nhiệm vụ này yêu cầu mức độ tự chủ tối thiểu nào?". Chi phí khi làm sai điều này là không đối xứng. Cấp độ Nó là gì Sử dụng khi L0 · Gọi LLM đơn lẻ Một lời nhắc → một phản hồi Phân loại, trích xuất, tóm tắt L1 · LLM tăng cường + truy xuất, + công cụ, + bộ nhớ Hỏi đáp trên tài liệu, trợ lý đơn giản L2 · Quy trình làm việc Mã xác định điều phối các bước LLM Đường dẫn đã biết; tính dự đoán quan trọng L3 · Điều phối viên-Người thực hiện LLM phân tách trong một đồ thị giới hạn Song song

Một tiêu chuẩn để xây dựng các tác nhân AI sản xuất (+ kỹ năng Claude Code có thể cài đặt)