Hiển thị HN: Chương trình nghị sự Intel MD – lược đồ và CLI để kiểm tra tóm tắt rủi ro chiến lược LLM
URL bài viết: https://github.com/vassiliylakhonin/agenda-intelligence-md URL nhận xét: https://news.ycombinator.com/item?id=48160912 Điểm: 1 # Bình luận: 0
Chương trình nghị sự tình báo MD
LỚP CI / MCP / KIỂM TOÁN BẰNG CHỨNG CHO CÁC ĐẠI LÝ TRÍ TUỆ CHIẾN LƯỢC — giao thức, lược đồ JSON, máy chủ CLI và MCP để xác thực, chấm điểm và kiểm tra cấu trúc đầu ra của tác nhân rủi ro chiến lược. Bề mặt kỷ luật-bằng chứng dành cho các kỹ năng suy luận ưu tiên tính điểm (Nhà phân tích Global Think Tank, Trung Á + Caspian, Vùng Vịnh + Trung Đông). Nguồn mở.
Lớp bằng chứng và đánh giá dành cho các đặc vụ tình báo chiến lược.
Một giao thức, bộ lược đồ JSON, bộ công cụ tương thích CLI và MCP giúp các tác nhân AI
chuyển từ bản tóm tắt không được hỗ trợ sang bản tóm tắt rủi ro chiến lược có thể kiểm toán được:
điều gì đã thay đổi
tại sao nó lại quan trọng
những gì được chứng minh bằng bằng chứng
điều gì không chắc chắn
ai được hay mất đòn bẩy
kịch bản nào hợp lý
xem gì tiếp theo
Nó được xây dựng cho các kỹ sư về chính sách vận chuyển, biện pháp trừng phạt, quy định,
các tác nhân rủi ro địa chính trị, rủi ro thị trường và tình báo chiến lược - trong đó
đầu ra phải được nhà phân tích xem xét, không chỉ nghe có vẻ hợp lý.
Đường cơ sở ví dụ đi kèm (5 trường hợp, được sao chép bằng python3 evals/run_benchmark.py):
thước đo
giá trị
điểm trung bình
87,0 / 100
trường hợp
5 (Đạo luật AI của EU, CBAM của EU, vận chuyển trên Biển Đỏ, định tuyến trừng phạt, Phổ biến BIS AI)
lược đồ hợp lệ
100%
với gói bằng chứng
100%
với kiểm tra cấp yêu cầu
100%
bằng chứng mồ côi
0
Đây là gì
Giao thức Markdown (Agenda-Intelligence.md) — một lý luận có cấu trúc
tác nhân quy trình công việc có thể làm theo.
Lược đồ JSON - xác thực cấu trúc ngắn gọn, gói bằng chứng, thẻ nhớ,
ống kính biểu hiện.
Kiểm tra CLI - xác thực-ngắn gọn, xác thực-bằng chứng, điểm số, bác sĩ
để xác thực kiểu CI của đầu ra tác nhân.
Máy chủ MCP - máy chủ MCP stdio thực sự (agenda-intelligence-mcp)
phơi bày các công cụ xác thực, đọc và chấm điểm.
Bộ công cụ đánh giá ban đầu — phiếu tự đánh giá, lời nhắc đánh giá LLM, danh sách kiểm tra con người, mẫu
trường hợp, hạt chuẩn.
Chính sách nguồn / bằng chứng — các quy tắc rõ ràng về kỷ luật ở cấp độ xác nhận quyền sở hữu, bao gồm các thẻ xuất xứ theo yêu cầu bồi thường (Trục A: [chính] [phụ] [do người dùng cung cấp] [suy luận] [đánh giá của nhà phân tích]; Trục B: [xác minh] [rủi ro cũ: YYYY-MM]). Xem kỹ năng/chương trình nghị sự-thông minh/tài liệu tham khảo/evidence-discipline.md.
Trình theo dõi vòng đời tín hiệu — đánh dấu + lược đồ JSON để theo dõi tín hiệu qua các phiên (được phát hiện → phát triển → tăng cấp → ổn định → giải quyết → được lưu trữ). Xem kỹ năng/chương trình nghị sự-thông minh/tham khảo/signal-lifecycle.md và lược đồ/signal-tracker.schema.json.
Kỹ năng chuẩn hóa nguồn (skills/source-ingest/) — chuẩn hóa tài liệu (PDF, DOCX, URL) thành các bản ghi nguồn có cấu trúc cho các gói bằng chứng.
Thấu kính khu vực & khu vực - gói tham chiếu nhỏ gọn bên trong giao thức
(Trung Á & Caspian, Trung Đông, EU; biện pháp trừng phạt, kiểm soát xuất khẩu). cho
phân tích sâu theo khu vực, sử dụng các kỹ năng chuyên môn theo chiều dọc chuyên dụng:
Trung Á + Caspi
hoặc Vịnh + Trung Đông.
Vị trí của nó trong ngăn xếp AI sản xuất
Kỹ năng suy luận (hợp đồng lý luận giảm giá đầu tiên cho đại lý):
Nhà phân tích Global Think Tank - theo chiều ngang: chính sách, biện pháp trừng phạt, quy định, địa chính trị, bản ghi nhớ thương mại
Trung Á + Kỹ năng trí tuệ lai Caspian — dọc: trừng phạt, AML, ngân hàng, rủi ro hành lang ở Trung Á / Caspian
Kỹ năng tình báo lai vùng Vịnh + Trung Đông - theo chiều dọc: Lệnh trừng phạt Iran, ngân hàng GCC, tài sản có chủ quyền, rủi ro điểm nghẽn hàng hải
Lớp bằng chứng & kiểm toán (CI/MCP/lược đồ):
→ Agenda Intelligence MD (repo này) - xác thực, cho điểm và kiểm tra cấu trúc đầu ra của tác nhân rủi ro chiến lược
Các kỹ năng xác định cách các tác nhân suy luận. Agenda Intelligence MD xác định cách kiểm tra đầu ra. Họ cùng nhau cho phép các đặc vụ tạo ra thông tin chiến lược có thể kiểm tra được - không chỉ là những bản tóm tắt nghe có vẻ hợp lý.
Đây không phải là gì
Không phải là người xác minh tính xác thực. Nó không kiểm tra xem các tuyên bố có đúng hay không.
Nó kiểm tra xem chúng có cấu trúc hợp lý, được dán nhãn bằng chứng và
mang tính quyết định.
Không phải là một đại lý tin tức tự trị. Nó không thu thập dữ liệu, truy xuất hoặc xếp hạng
nguồn của chính nó.
Không phải là một công cụ truy xuất nguồn. Truy xuất trực tiếp không được thực hiện.
Không phải là sự thay thế cho đánh giá của nhà phân tích. Tín hiệu đạt/không đạt cho bạn biết
hình thức chứ không phải bản chất.
Không phải là một sự đảm bảo về tính chính xác. Nó đưa ra những bằng chứng còn thiếu và
móc không chắc chắn; nó không đảm bảo cho họ.
Chưa phải là một bộ điểm chuẩn trưởng thành. Hạt giống chuẩn trong
evals/benchmark_set.json là điểm bắt đầu, kết quả chưa được xác thực.
Khởi động nhanh 60 giây
# Từ PyPI
pip cài đặt chương trình nghị sự-thông minh-md
# Hoặc bánh xe bị ghim:
# cài đặt pip https://github.com/vassiliylakhonin/agenda-intelligence-md/releases/download/v0.7.3/agenda_intelligence_md-0.7.3-py3-none-any.whl
# 1. Nhận gói nguồn cho tên miền
chương trình nghị sự-trí thông minh bắt đầu công nghệ-ai
# 2. Xác thực bản tóm tắt do tác nhân tạo dựa trên lược đồ
chương trình nghị sự-thông minh xác thực-ví dụ ngắn gọn/agenda-brief.json
# 3. Chấm điểm tóm tắt (tiêu chí đánh giá cấu trúc 0-100 theo kinh nghiệm)
ví dụ về điểm thông minh của chương trình nghị sự/agenda-brief.json
#4. Ghi điểm bằng phản hồi liên kết với bằng chứng
ví dụ về điểm thông minh của chương trình nghị sự/agenda-brief.json --evidence ví dụ/source/evidence-pack.json
# 5. Chạy bảng cấu trúc trên tất cả các ví dụ được đóng gói
ví dụ về chương trình nghị sự thông minh/được hỗ trợ từ nguồn --strict --min-score 80
#6. Chẩn đoán cài đặt cục bộ + bề mặt công cụ MCP
bác sĩ tình báo chương trình nghị sự
# 7. In cấu hình máy khách MCP cục bộ
chương trình nghị sự thông minh mcp-config --con trỏ máy khách
Kết quả ghi điểm dự kiến:
điểm: 90/100
lưu ý: Điểm cấu trúc/bằng chứng-kỷ luật theo kinh nghiệm; không xác minh tính trung thực thực tế.
bằng chứng_support: ... yêu cầu hỗ trợ: hỗ trợ 1/1 ...
Ví dụ điển hình: Đạo luật AI của EU
Bản tóm tắt cơ sở yếu so với bản tóm tắt Chương trình nghị sự-Trí thông minh, cùng với bằng chứng
gói được sử dụng để hỗ trợ mỗi yêu cầu.
Tóm tắt: ví dụ/nguồn được hỗ trợ/eu-ai-act.md
Tóm tắt JSON hợp lệ theo lược đồ: ví dụ/nguồn được hỗ trợ/eu-ai-act.brief.json
Gói bằng chứng (minh họa - URL giữ chỗ, không phải trích dẫn trực tiếp):
ví dụ/nguồn được hỗ trợ/eu-ai-act.evidence.json
Kiểm tra cấp độ yêu cầu: ví dụ/nguồn được hỗ trợ/eu-ai-act.audit.json
Cặp trước/sau: ví dụ/trước-sau/
Các URL bằng chứng trong các ví dụ điển hình là phần giữ chỗ mang tính minh họa.
Vấn đề là hình thức của lý luận dựa trên bằng chứng chứ không phải trích dẫn trực tiếp.
Chạy toàn bộ đường dẫn trên
Nguồn tin: Hacker News LLM — Tác giả: vassilbek. Bản dịch tiếng Việt do AI thực hiện, có thể có sai sót.