Bỏ qua tới nội dung chính
Quay lại tin tức

Hiển thị HN: Chương trình nghị sự Intel MD – lược đồ và CLI để kiểm tra tóm tắt rủi ro chiến lược LLM

Hacker News LLM· vassilbek· 16/5/2026general

URL bài viết: https://github.com/vassiliylakhonin/agenda-intelligence-md URL nhận xét: https://news.ycombinator.com/item?id=48160912 Điểm: 1 # Bình luận: 0

Chương trình nghị sự tình báo MD LỚP CI / MCP / KIỂM TOÁN BẰNG CHỨNG CHO CÁC ĐẠI LÝ TRÍ TUỆ CHIẾN LƯỢC — giao thức, lược đồ JSON, máy chủ CLI và MCP để xác thực, chấm điểm và kiểm tra cấu trúc đầu ra của tác nhân rủi ro chiến lược. Bề mặt kỷ luật-bằng chứng dành cho các kỹ năng suy luận ưu tiên tính điểm (Nhà phân tích Global Think Tank, Trung Á + Caspian, Vùng Vịnh + Trung Đông). Nguồn mở. Lớp bằng chứng và đánh giá dành cho các đặc vụ tình báo chiến lược. Một giao thức, bộ lược đồ JSON, bộ công cụ tương thích CLI và MCP giúp các tác nhân AI chuyển từ bản tóm tắt không được hỗ trợ sang bản tóm tắt rủi ro chiến lược có thể kiểm toán được: điều gì đã thay đổi tại sao nó lại quan trọng những gì được chứng minh bằng bằng chứng điều gì không chắc chắn ai được hay mất đòn bẩy kịch bản nào hợp lý xem gì tiếp theo Nó được xây dựng cho các kỹ sư về chính sách vận chuyển, biện pháp trừng phạt, quy định, các tác nhân rủi ro địa chính trị, rủi ro thị trường và tình báo chiến lược - trong đó đầu ra phải được nhà phân tích xem xét, không chỉ nghe có vẻ hợp lý. Đường cơ sở ví dụ đi kèm (5 trường hợp, được sao chép bằng python3 evals/run_benchmark.py): thước đo giá trị điểm trung bình 87,0 / 100 trường hợp 5 (Đạo luật AI của EU, CBAM của EU, vận chuyển trên Biển Đỏ, định tuyến trừng phạt, Phổ biến BIS AI) lược đồ hợp lệ 100% với gói bằng chứng 100% với kiểm tra cấp yêu cầu 100% bằng chứng mồ côi 0 Đây là gì Giao thức Markdown (Agenda-Intelligence.md) — một lý luận có cấu trúc tác nhân quy trình công việc có thể làm theo. Lược đồ JSON - xác thực cấu trúc ngắn gọn, gói bằng chứng, thẻ nhớ, ống kính biểu hiện. Kiểm tra CLI - xác thực-ngắn gọn, xác thực-bằng chứng, điểm số, bác sĩ để xác thực kiểu CI của đầu ra tác nhân. Máy chủ MCP - máy chủ MCP stdio thực sự (agenda-intelligence-mcp) phơi bày các công cụ xác thực, đọc và chấm điểm. Bộ công cụ đánh giá ban đầu — phiếu tự đánh giá, lời nhắc đánh giá LLM, danh sách kiểm tra con người, mẫu trường hợp, hạt chuẩn. Chính sách nguồn / bằng chứng — các quy tắc rõ ràng về kỷ luật ở cấp độ xác nhận quyền sở hữu, bao gồm các thẻ xuất xứ theo yêu cầu bồi thường (Trục A: [chính] [phụ] [do người dùng cung cấp] [suy luận] [đánh giá của nhà phân tích]; Trục B: [xác minh] [rủi ro cũ: YYYY-MM]). Xem kỹ năng/chương trình nghị sự-thông minh/tài liệu tham khảo/evidence-discipline.md. Trình theo dõi vòng đời tín hiệu — đánh dấu + lược đồ JSON để theo dõi tín hiệu qua các phiên (được phát hiện → phát triển → tăng cấp → ổn định → giải quyết → được lưu trữ). Xem kỹ năng/chương trình nghị sự-thông minh/tham khảo/signal-lifecycle.md và lược đồ/signal-tracker.schema.json. Kỹ năng chuẩn hóa nguồn (skills/source-ingest/) — chuẩn hóa tài liệu (PDF, DOCX, URL) thành các bản ghi nguồn có cấu trúc cho các gói bằng chứng. Thấu kính khu vực & khu vực - gói tham chiếu nhỏ gọn bên trong giao thức (Trung Á & Caspian, Trung Đông, EU; biện pháp trừng phạt, kiểm soát xuất khẩu). cho phân tích sâu theo khu vực, sử dụng các kỹ năng chuyên môn theo chiều dọc chuyên dụng: Trung Á + Caspi hoặc Vịnh + Trung Đông. Vị trí của nó trong ngăn xếp AI sản xuất Kỹ năng suy luận (hợp đồng lý luận giảm giá đầu tiên cho đại lý): Nhà phân tích Global Think Tank - theo chiều ngang: chính sách, biện pháp trừng phạt, quy định, địa chính trị, bản ghi nhớ thương mại Trung Á + Kỹ năng trí tuệ lai Caspian — dọc: trừng phạt, AML, ngân hàng, rủi ro hành lang ở Trung Á / Caspian Kỹ năng tình báo lai vùng Vịnh + Trung Đông - theo chiều dọc: Lệnh trừng phạt Iran, ngân hàng GCC, tài sản có chủ quyền, rủi ro điểm nghẽn hàng hải Lớp bằng chứng & kiểm toán (CI/MCP/lược đồ): → Agenda Intelligence MD (repo này) - xác thực, cho điểm và kiểm tra cấu trúc đầu ra của tác nhân rủi ro chiến lược Các kỹ năng xác định cách các tác nhân suy luận. Agenda Intelligence MD xác định cách kiểm tra đầu ra. Họ cùng nhau cho phép các đặc vụ tạo ra thông tin chiến lược có thể kiểm tra được - không chỉ là những bản tóm tắt nghe có vẻ hợp lý. Đây không phải là gì Không phải là người xác minh tính xác thực. Nó không kiểm tra xem các tuyên bố có đúng hay không. Nó kiểm tra xem chúng có cấu trúc hợp lý, được dán nhãn bằng chứng và mang tính quyết định. Không phải là một đại lý tin tức tự trị. Nó không thu thập dữ liệu, truy xuất hoặc xếp hạng nguồn của chính nó. Không phải là một công cụ truy xuất nguồn. Truy xuất trực tiếp không được thực hiện. Không phải là sự thay thế cho đánh giá của nhà phân tích. Tín hiệu đạt/không đạt cho bạn biết hình thức chứ không phải bản chất. Không phải là một sự đảm bảo về tính chính xác. Nó đưa ra những bằng chứng còn thiếu và móc không chắc chắn; nó không đảm bảo cho họ. Chưa phải là một bộ điểm chuẩn trưởng thành. Hạt giống chuẩn trong evals/benchmark_set.json là điểm bắt đầu, kết quả chưa được xác thực. Khởi động nhanh 60 giây # Từ PyPI pip cài đặt chương trình nghị sự-thông minh-md # Hoặc bánh xe bị ghim: # cài đặt pip https://github.com/vassiliylakhonin/agenda-intelligence-md/releases/download/v0.7.3/agenda_intelligence_md-0.7.3-py3-none-any.whl # 1. Nhận gói nguồn cho tên miền chương trình nghị sự-trí thông minh bắt đầu công nghệ-ai # 2. Xác thực bản tóm tắt do tác nhân tạo dựa trên lược đồ chương trình nghị sự-thông minh xác thực-ví dụ ngắn gọn/agenda-brief.json # 3. Chấm điểm tóm tắt (tiêu chí đánh giá cấu trúc 0-100 theo kinh nghiệm) ví dụ về điểm thông minh của chương trình nghị sự/agenda-brief.json #4. Ghi điểm bằng phản hồi liên kết với bằng chứng ví dụ về điểm thông minh của chương trình nghị sự/agenda-brief.json --evidence ví dụ/source/evidence-pack.json # 5. Chạy bảng cấu trúc trên tất cả các ví dụ được đóng gói ví dụ về chương trình nghị sự thông minh/được hỗ trợ từ nguồn --strict --min-score 80 #6. Chẩn đoán cài đặt cục bộ + bề mặt công cụ MCP bác sĩ tình báo chương trình nghị sự # 7. In cấu hình máy khách MCP cục bộ chương trình nghị sự thông minh mcp-config --con trỏ máy khách Kết quả ghi điểm dự kiến: điểm: 90/100 lưu ý: Điểm cấu trúc/bằng chứng-kỷ luật theo kinh nghiệm; không xác minh tính trung thực thực tế. bằng chứng_support: ... yêu cầu hỗ trợ: hỗ trợ 1/1 ... Ví dụ điển hình: Đạo luật AI của EU Bản tóm tắt cơ sở yếu so với bản tóm tắt Chương trình nghị sự-Trí thông minh, cùng với bằng chứng gói được sử dụng để hỗ trợ mỗi yêu cầu. Tóm tắt: ví dụ/nguồn được hỗ trợ/eu-ai-act.md Tóm tắt JSON hợp lệ theo lược đồ: ví dụ/nguồn được hỗ trợ/eu-ai-act.brief.json Gói bằng chứng (minh họa - URL giữ chỗ, không phải trích dẫn trực tiếp): ví dụ/nguồn được hỗ trợ/eu-ai-act.evidence.json Kiểm tra cấp độ yêu cầu: ví dụ/nguồn được hỗ trợ/eu-ai-act.audit.json Cặp trước/sau: ví dụ/trước-sau/ Các URL bằng chứng trong các ví dụ điển hình là phần giữ chỗ mang tính minh họa. Vấn đề là hình thức của lý luận dựa trên bằng chứng chứ không phải trích dẫn trực tiếp. Chạy toàn bộ đường dẫn trên

Nguồn tin: Hacker News LLM — Tác giả: vassilbek. Bản dịch tiếng Việt do AI thực hiện, có thể có sai sót.