Bỏ qua tới nội dung chính
Quay lại tin tức

Sự phát triển về giá, giới hạn sản xuất và cạnh tranh thị trường trong suy luận LLM

Hacker News LLM· root-parent· 7/6/2026general

URL bài viết: https://arxiv.org/abs/2603.28576 URL bình luận: https://news.ycombinator.com/item?id=48435221 Điểm: 3 Bình luận: 0

Khoa học Máy tính > Kỹ thuật Tính toán, Tài chính và Khoa học arXiv:2603.28576 (cs) [Đệ trình ngày 30/3/2026] Tiêu đề: Định luật Siêu-Moore Phân cấp: Diễn biến Giá cả, Giới hạn Sản xuất và Cạnh tranh Thị trường trong Dịch vụ Suy luận Mô hình Ngôn ngữ Lớn Tác giả: Mingdeng Du Xem bản PDF của bài báo có tiêu đề Định luật Siêu-Moore Phân cấp: Diễn biến Giá cả, Giới hạn Sản xuất và Cạnh tranh Thị trường trong Dịch vụ Suy luận Mô hình Ngôn ngữ Lớn, của Mingdeng Du Xem PDF HTML (thử nghiệm) Tóm tắt: Bài báo này cung cấp phân tích kinh tế hệ thống đầu tiên về định giá token trong thị trường suy luận mô hình ngôn ngữ lớn (LLM). Bằng cách tổng hợp một bộ dữ liệu mới tích hợp dữ liệu API của OpenRouter (318 mô hình), hồ sơ của Epoch AI (3.237 mô hình) và 62 quan sát cột mốc được kiểm định chéo trong giai đoạn 2020-2026, chúng tôi ghi nhận mức giảm giá token xấp xỉ 600 lần và đề xuất giả thuyết "Định luật Siêu-Moore Phân cấp". Các mô hình cấp phổ thông có thời gian bán hủy giá là 1,10 năm và các mô hình cấp trung là 1,55 năm – cả hai đều nhanh hơn đáng kể so với mốc hai năm của Định luật Moore – trong khi các mô hình chủ lực cho thấy sự phù hợp hàm mũ gần bằng 0 (R^2 = 0,031) do mức phí cao cho khả năng suy luận trung bình gấp 31,5 lần so với giá không suy luận. Một kiểm định Chow về điểm gãy cấu trúc xác định tháng 5/2024 là điểm uốn thị trường quan trọng (F = 5,74, p = 0,005), đánh dấu sự chuyển đổi từ tăng tốc giá do công nghệ sang tăng tốc giá do cạnh tranh. Phân tích chi phí cho thấy phần dư năng suất yếu tố tổng hợp chiếm khoảng 103,7% mức giảm chi phí, trong đó phần cứng GPU chỉ đóng góp -0,9%, khẳng định rằng đổi mới phần mềm và kiến trúc – chứ không phải tiến bộ phần cứng – là động lực chính của sự suy giảm. Phân tích Bao bọc Dữ liệu (DEA) cho thấy Chỉ số Năng suất Malmquist đạt đỉnh 4,11 trong quý 1-4 năm 2024, với sự dịch chuyển ranh giới công nghệ (TC = 4,13) là động lực chủ yếu. Độ co giãn của giá suy luận theo chi phí đào tạo là 0,432, và khoảng cách chi phí đào tạo gấp 63 lần giữa các công ty Hoa Kỳ và Trung Quốc có thể được quy cho sự đổi mới kiến trúc (sự khác biệt $/FLOP không đáng kể, p = 0,228) chứ không phải sự khác biệt về giá yếu tố. Mức độ tập trung thị trường giảm mạnh, với chỉ số HHI giảm từ 4.558 xuống 2.086 trong ba năm. Những phát hiện này thiết lập kinh tế học token như một lĩnh vực phụ riêng biệt của định giá hàng hóa kỹ thuật số và mang lại ý nghĩa đối với chính sách cạnh tranh, khả năng tiếp cận AI và quản trị công nghệ quốc tế. Bình luận: 23 trang, 12 hình, 6 bảng Chủ đề: Kỹ thuật Tính toán, Tài chính và Khoa học (cs.CE) Các lớp ACM: J.4; K.4.4 Trích dẫn: arXiv:2603.28576 [cs.CE] (hoặc arXiv:2603.28576v1 [cs.CE] cho phiên bản này) https://doi.org/10.48550/arXiv.2603.28576 Tập trung để tìm hiểu thêm DOI do arXiv cấp thông qua DataCite Lịch sử đệ trình Từ: Mingdeng Du [xem email] [v1] Thứ Hai, 30/3/2026 15:28:50 UTC (2.404 KB) Liên kết toàn văn: Truy cập Bài báo: Xem bản PDF của bài báo có tiêu đề Định luật Siêu-Moore Phân cấp: Diễn biến Giá cả, Giới hạn Sản xuất và Cạnh tranh Thị trường trong Dịch vụ Suy luận Mô hình Ngôn ngữ Lớn, của Mingdeng Du Xem PDF HTML (thử nghiệm) Nguồn TeX xem giấy phép Ngữ cảnh duyệt hiện tại: cs.CE < trước | tiếp theo > mới | gần đây | 2026-03 Thay đổi để duyệt theo: cs Tài liệu tham khảo & Trích dẫn NASA ADS Google Scholar Semantic Scholar xuất trích dẫn BibTeX Đang tải... Trích dẫn định dạng BibTeX × Đang tải... Dữ liệu được cung cấp bởi: Đánh dấu Công cụ thư mục Công cụ thư mục và trích dẫn Khám phá thư mục Khám phá thư mục (Khám phá là gì?) Connected Papers Connected Papers (Connected Papers là gì?) Litmaps Litmaps (Litmaps là gì?) scite.ai scite Smart Citations (Smart Citations là gì?) Mã, Dữ liệu, Phương tiện Mã, Dữ liệu và Phương tiện liên quan đến bài viết này alphaXiv alphaXiv (alphaXiv là gì?) Liên kết đến Mã CatalyzeX Code Finder for Papers (CatalyzeX là gì?) DagsHub DagsHub (DagsHub là gì?) GotitPub Gotit.pub (GotitPub là gì?) Huggingface Hugging Face (Huggingface là gì?) ScienceCast ScienceCast (ScienceCast là gì?) Bản thử nghiệm Bản thử nghiệm Replicate Replicate (Replicate là gì?) Spaces Hugging Face Spaces (Spaces là gì?) Spaces TXYZ.AI (TXYZ.AI là gì?) Các bài báo liên quan Công cụ đề xuất và tìm kiếm Liên kết đến Influence Flower Influence Flower (Influence Flowers là gì?) Công cụ đề xuất cốt lõi CORE Recommender (CORE là gì?) Tác giả Địa điểm Tổ chức Chủ đề Về arXivLabs arXivLabs: các dự án thử nghiệm với các cộng tác viên cộng đồng arXivLabs là một khuôn khổ cho phép các cộng tác viên phát triển và chia sẻ các tính năng arXiv mới trực tiếp trên trang web của chúng tôi. Cả cá nhân và tổ chức làm việc với arXivLabs đều đã chấp nhận và tuân thủ các giá trị của chúng tôi về sự cởi mở, cộng đồng, sự xuất sắc và quyền riêng tư dữ liệu người dùng. arXiv cam kết với những giá trị này và chỉ làm việc với các đối tác tuân thủ chúng. Bạn có ý tưởng cho một dự án sẽ mang lại giá trị cho cộng đồng arXiv? Tìm hiểu thêm về arXivLabs. Những tác giả nào của bài báo này là người xác nhận? | Tắt MathJax (MathJax là gì?)

Nguồn tin: Hacker News LLM — Tác giả: root-parent. Bản dịch tiếng Việt do AI thực hiện, có thể có sai sót.