Sự phát triển về giá, giới hạn sản xuất và cạnh tranh thị trường trong suy luận LLM
URL bài viết: https://arxiv.org/abs/2603.28576 URL bình luận: https://news.ycombinator.com/item?id=48435221 Điểm: 3 Bình luận: 0
Khoa học Máy tính > Kỹ thuật Tính toán, Tài chính và Khoa học
arXiv:2603.28576 (cs)
[Đệ trình ngày 30/3/2026]
Tiêu đề: Định luật Siêu-Moore Phân cấp: Diễn biến Giá cả, Giới hạn Sản xuất và Cạnh tranh Thị trường trong Dịch vụ Suy luận Mô hình Ngôn ngữ Lớn
Tác giả: Mingdeng Du
Xem bản PDF của bài báo có tiêu đề Định luật Siêu-Moore Phân cấp: Diễn biến Giá cả, Giới hạn Sản xuất và Cạnh tranh Thị trường trong Dịch vụ Suy luận Mô hình Ngôn ngữ Lớn, của Mingdeng Du
Xem PDF
HTML (thử nghiệm)
Tóm tắt: Bài báo này cung cấp phân tích kinh tế hệ thống đầu tiên về định giá token trong thị trường suy luận mô hình ngôn ngữ lớn (LLM). Bằng cách tổng hợp một bộ dữ liệu mới tích hợp dữ liệu API của OpenRouter (318 mô hình), hồ sơ của Epoch AI (3.237 mô hình) và 62 quan sát cột mốc được kiểm định chéo trong giai đoạn 2020-2026, chúng tôi ghi nhận mức giảm giá token xấp xỉ 600 lần và đề xuất giả thuyết "Định luật Siêu-Moore Phân cấp". Các mô hình cấp phổ thông có thời gian bán hủy giá là 1,10 năm và các mô hình cấp trung là 1,55 năm – cả hai đều nhanh hơn đáng kể so với mốc hai năm của Định luật Moore – trong khi các mô hình chủ lực cho thấy sự phù hợp hàm mũ gần bằng 0 (R^2 = 0,031) do mức phí cao cho khả năng suy luận trung bình gấp 31,5 lần so với giá không suy luận. Một kiểm định Chow về điểm gãy cấu trúc xác định tháng 5/2024 là điểm uốn thị trường quan trọng (F = 5,74, p = 0,005), đánh dấu sự chuyển đổi từ tăng tốc giá do công nghệ sang tăng tốc giá do cạnh tranh. Phân tích chi phí cho thấy phần dư năng suất yếu tố tổng hợp chiếm khoảng 103,7% mức giảm chi phí, trong đó phần cứng GPU chỉ đóng góp -0,9%, khẳng định rằng đổi mới phần mềm và kiến trúc – chứ không phải tiến bộ phần cứng – là động lực chính của sự suy giảm. Phân tích Bao bọc Dữ liệu (DEA) cho thấy Chỉ số Năng suất Malmquist đạt đỉnh 4,11 trong quý 1-4 năm 2024, với sự dịch chuyển ranh giới công nghệ (TC = 4,13) là động lực chủ yếu. Độ co giãn của giá suy luận theo chi phí đào tạo là 0,432, và khoảng cách chi phí đào tạo gấp 63 lần giữa các công ty Hoa Kỳ và Trung Quốc có thể được quy cho sự đổi mới kiến trúc (sự khác biệt $/FLOP không đáng kể, p = 0,228) chứ không phải sự khác biệt về giá yếu tố. Mức độ tập trung thị trường giảm mạnh, với chỉ số HHI giảm từ 4.558 xuống 2.086 trong ba năm. Những phát hiện này thiết lập kinh tế học token như một lĩnh vực phụ riêng biệt của định giá hàng hóa kỹ thuật số và mang lại ý nghĩa đối với chính sách cạnh tranh, khả năng tiếp cận AI và quản trị công nghệ quốc tế.
Bình luận:
23 trang, 12 hình, 6 bảng
Chủ đề:
Kỹ thuật Tính toán, Tài chính và Khoa học (cs.CE)
Các lớp ACM:
J.4; K.4.4
Trích dẫn:
arXiv:2603.28576 [cs.CE]
(hoặc arXiv:2603.28576v1 [cs.CE] cho phiên bản này)
https://doi.org/10.48550/arXiv.2603.28576
Tập trung để tìm hiểu thêm
DOI do arXiv cấp thông qua DataCite
Lịch sử đệ trình
Từ: Mingdeng Du [xem email]
[v1]
Thứ Hai, 30/3/2026 15:28:50 UTC (2.404 KB)
Liên kết toàn văn:
Truy cập Bài báo:
Xem bản PDF của bài báo có tiêu đề Định luật Siêu-Moore Phân cấp: Diễn biến Giá cả, Giới hạn Sản xuất và Cạnh tranh Thị trường trong Dịch vụ Suy luận Mô hình Ngôn ngữ Lớn, của Mingdeng Du
Xem PDF
HTML (thử nghiệm)
Nguồn TeX
xem giấy phép
Ngữ cảnh duyệt hiện tại:
cs.CE
< trước
|
tiếp theo >
mới
|
gần đây
| 2026-03
Thay đổi để duyệt theo:
cs
Tài liệu tham khảo & Trích dẫn
NASA ADS
Google Scholar
Semantic Scholar
xuất trích dẫn BibTeX
Đang tải...
Trích dẫn định dạng BibTeX
×
Đang tải...
Dữ liệu được cung cấp bởi:
Đánh dấu
Công cụ thư mục
Công cụ thư mục và trích dẫn
Khám phá thư mục
Khám phá thư mục (Khám phá là gì?)
Connected Papers
Connected Papers (Connected Papers là gì?)
Litmaps
Litmaps (Litmaps là gì?)
scite.ai
scite Smart Citations (Smart Citations là gì?)
Mã, Dữ liệu, Phương tiện
Mã, Dữ liệu và Phương tiện liên quan đến bài viết này
alphaXiv
alphaXiv (alphaXiv là gì?)
Liên kết đến Mã
CatalyzeX Code Finder for Papers (CatalyzeX là gì?)
DagsHub
DagsHub (DagsHub là gì?)
GotitPub
Gotit.pub (GotitPub là gì?)
Huggingface
Hugging Face (Huggingface là gì?)
ScienceCast
ScienceCast (ScienceCast là gì?)
Bản thử nghiệm
Bản thử nghiệm
Replicate
Replicate (Replicate là gì?)
Spaces
Hugging Face Spaces (Spaces là gì?)
Spaces
TXYZ.AI (TXYZ.AI là gì?)
Các bài báo liên quan
Công cụ đề xuất và tìm kiếm
Liên kết đến Influence Flower
Influence Flower (Influence Flowers là gì?)
Công cụ đề xuất cốt lõi
CORE Recommender (CORE là gì?)
Tác giả
Địa điểm
Tổ chức
Chủ đề
Về arXivLabs
arXivLabs: các dự án thử nghiệm với các cộng tác viên cộng đồng
arXivLabs là một khuôn khổ cho phép các cộng tác viên phát triển và chia sẻ các tính năng arXiv mới trực tiếp trên trang web của chúng tôi.
Cả cá nhân và tổ chức làm việc với arXivLabs đều đã chấp nhận và tuân thủ các giá trị của chúng tôi về sự cởi mở, cộng đồng, sự xuất sắc và quyền riêng tư dữ liệu người dùng. arXiv cam kết với những giá trị này và chỉ làm việc với các đối tác tuân thủ chúng.
Bạn có ý tưởng cho một dự án sẽ mang lại giá trị cho cộng đồng arXiv? Tìm hiểu thêm về arXivLabs.
Những tác giả nào của bài báo này là người xác nhận? |
Tắt MathJax (MathJax là gì?)
Nguồn tin: Hacker News LLM — Tác giả: root-parent. Bản dịch tiếng Việt do AI thực hiện, có thể có sai sót.