
Phòng trưng bày kiến trúc LLM mới
Tôi tập hợp một Thư viện Kiến trúc LLM mới để thu thập các số liệu kiến trúc từ các bài viết so sánh gần đây của tôi ở một nơi, cùng với các tờ thông tin và liên kết nhỏ gọn.
Tôi đã tập hợp một Thư viện Kiến trúc LLM mới để thu thập các số liệu kiến trúc từ So sánh Kiến trúc LLM lớn và Giấc mơ mùa xuân dành cho LLM trọng lượng mở ở một nơi.
Mục đích là giúp việc duyệt nhanh các kiến trúc LLM trọng lượng mở gần đây dễ dàng hơn mà không phải nhảy qua lại giữa các phần bài viết.
Phòng trưng bày bao gồm:
số liệu kiến trúc có độ phân giải cao có thể nhấp vào
tờ thông tin nhỏ gọn cho từng mô hình
ngày, liên kết config.json, liên kết báo cáo công nghệ và liên kết triển khai ngay từ đầu nếu có
người giải thích khái niệm ngắn gọn về những thứ như GQA, MLA, SWA, QK-Norm, NoPE, Gated DeltaNet và các ý tưởng liên quan
Bạn có thể tìm thấy nó ở đây:
Mở Phòng trưng bày Kiến trúc LLM
Nếu bạn phát hiện một tờ thông tin không chính xác, kiến trúc bị gắn nhãn sai hoặc liên kết bị hỏng thì đó cũng là một liên kết có vấn đề ở đầu trang thư viện.
Nguồn tin: Sebastian Raschka. Bản dịch tiếng Việt do AI thực hiện, có thể có sai sót.