Với tư cách là một người dùng, tôi thực sự cảm thấy mệt mỏi khi phải phân tích các trang web nặng về tiếp thị như hiện nay.
Tôi luôn yêu thích sự đơn giản của gopher và gemini web. Gần đây, tôi thường xuyên tự thêm `/llm.txt` vào hầu hết các trang web mình truy cập vì tôi nhận thấy nội dung dành cho các mô hình ngôn ngữ lớn (LLM) rất trực tiếp và rõ ràng.
Điều khó chịu duy nhất là các trình duyệt web như Chrome không hiển thị được định dạng markdown. Vậy liệu cuộc cách mạng AI có thể vô tình khắc phục được web cho con người hay không? Bạn có thấy mình cũng làm điều tương tự không?
URL bình luận: https://news.ycombinator.com/item?id=48410589
Điểm: 19
Số bình luận: 27
Hỏi HN: Liệu web dành cho máy móc (/llm.txt) có phải là thứ chúng ta mong muốn có được với tư cách con người? | Hacker NewsHacker Newsmới | cũ | bình luận | hỏi | hiển thị | việc làm | gửiđăng nhập
Hỏi HN: Liệu web dành cho máy móc (/llm.txt) có phải là thứ chúng ta mong muốn có được với tư cách con người?19 điểm bởi sunshine-o 1 giờ trước | ẩn | cũ | yêu thích | 27 bình luậnVới tư cách con người, tôi thực sự mệt mỏi khi phải phân tích trang web nặng tính tiếp thị mà chúng ta có ngày nay.
Tôi luôn yêu thích sự đơn giản của web gopher và gemini.Gần đây, tôi thấy mình phải tự thêm `/llm.txt` vào hầu hết các trang web tôi truy cập vì tôi thấy nội dung dành cho các LLM (mô hình ngôn ngữ lớn) rất trực tiếp và rõ ràng.
Điều khó chịu duy nhất là các trình duyệt web như Chrome không hiển thị Markdown.Vậy liệu cuộc cách mạng AI có thể vô tình khắc phục web cho con người không?Bạn có thấy mình cũng làm điều tương tự không?
trợ giúp
ahriad 1 giờ trước | tiếp theo [–]
Chúng ta đã làm hỏng web cho con người đến mức phải xây dựng một web sạch cho máy móc, và giờ đây con người sẽ phải sử dụng máy móc để trải nghiệm lại một web sạch.
trả lời
dmos62 1 giờ trước | cha | tiếp theo [–]
Tôi tự hỏi tại sao chúng ta lại làm hỏng web.
trả lời
Eddy_Viscosity2 42 phút trước | gốc | cha | tiếp theo [–]
Vì những lý do tương tự khiến chúng ta cuối cùng làm ô nhiễm và làm hỏng mọi hệ thống và môi trường mà chúng ta sử dụng. Nếu có bất kỳ lợi ích nào có thể được khai thác cho một số người trong khi chi phí do nhiều người gánh chịu, thì điều này sẽ xảy ra và tạo ra một vòng phản hồi tích cực ngày càng lớn theo thời gian.Đó là quy luật của việc kiếm tiền.
trả lời
qsera 15 phút trước | gốc | cha | tiếp theo [–]
>thì điều này sẽ xảy ra và tạo ra một vòng phản hồi tích cực ngày càng lớn theo thời gian.Và bất chấp điều này, cuộc sống hiện đại được tạo ra bởi ảo tưởng rằng "các quy định" có hiệu quả..
trả lời
ahriad 1 giờ trước | gốc | cha | trước | tiếp theo [–]
Vì tiền! Quảng cáo tạo ra tiền.
trả lời
functionmouse 45 phút trước | gốc | cha | trước | tiếp theo [–]
Để làm hỏng người dùng, tất nhiên.
trả lời
noufalibrahim 53 phút trước | gốc | cha | trước | tiếp theo [–]
Để cải thiện trải nghiệm người dùng.
trả lời
marand23 23 phút trước | trước | tiếp theo [–]
Tôi chưa bao giờ nghĩ về điều đó trước đây nhưng kỷ nguyên LLM có thể là một hình thức phục hưng cho người khiếm thị trên Internet. Một trang web thay thế nơi chức năng của mỗi trang được mô tả bằng văn bản ngắn gọn nhưng chi tiết thay vì cấu trúc cây HTML cực kỳ dài dòng và phi tuyến tính.
trả lời
rickette 1 giờ trước | trước | tiếp theo [–]
Liệu có nhà cung cấp LLM nào thực sự sử dụng llms.txt không?Nếu tôi nhớ không nhầm, "tiêu chuẩn" này được thiết lập bởi một người nào đó nhưng không có sự tham gia của bất kỳ nhà phát triển AI lớn nào.
trả lời
HermanMartinus 55 phút trước | cha | tiếp theo [–]
Tôi có thể khẳng định chắc chắn rằng llms.txt không được sử dụng bởi bất kỳ nhà phát triển AI nào. Tôi điều hành một nền tảng blog với khoảng 80 nghìn blog và `/llms.txt` không được yêu cầu bởi bất cứ thứ gì (ngoài việc con người kiểm tra xem có đường dẫn llms.txt hay không).Tất cả các trang thông thường đều bị cạo dữ liệu một cách mạnh mẽ đến mức đó là một vấn đề tôi phải quản lý liên tục, nhưng không phải llms.txt.
trả lời
0123456789ABCDE 8 phút trước | gốc | cha | tiếp theo [–]
> Tôi có thể khẳng định chắc chắn rằng llms.txt không được sử dụng bởi bất kỳ nhà phát triển AI nào. https://developers.openai.com/llms.txt
https://docs.anthropic.com/llms.txt
https://geminicli.com/llms.txt
trả lời
nickserv 14 phút trước | gốc | cha | trước | tiếp theo [–]
Tôi đang thấy khá nhiều yêu cầu cho những trang này trên trang tài liệu GitBook của công ty tôi.Nhưng có lẽ đây là các nhà phát triển đang nhắm mục tiêu cụ thể vào các trang này để cung cấp cho bất kỳ LLM nào họ đang sử dụng.
isaachinman 44 phút trước | root | parent | prev | next [–]
Việc một blog tĩnh bị cạo dữ liệu có vấn đề gì không? Bạn có sử dụng CDN không?
trả lời
nickserv 17 phút trước | root | parent | next [–]
> một nền tảng blog với khoảng 80 nghìn blog. Nhưng không, tôi chắc rằng OP không biết về CDN.
trả lời
the_real_cher 25 phút trước | root | parent | prev | next [–]
Tất cả các blog đều là tĩnh phải không?
trả lời
0123456789ABCDE 6 phút trước | parent | prev | next [–]
Đúng vậy. Bất kỳ ai, dù chỉ một chút, hiểu rõ cách các tác nhân truy cập tài liệu, đều đã thực hiện thay đổi trên các trang của họ. Ví dụ: https://searchtxt-web.fly.dev/search?q=aws
trả lời
tacostakohashi 12 phút trước | prev | next [–]
Gần như vậy. Có một chu kỳ "enshittification" (biến chất) đang diễn ra. Web từng rất tốt, chủ yếu là văn bản và hữu ích, cách đây 25 năm. Sau đó... dần dần... chúng ta đã thêm JavaScript, rồi AJAX, CSS, Flash, quảng cáo xen kẽ, cửa sổ bật lên, tiếp thị, mạng xã hội, thuật toán, doomscrolling (cuộn tin tức tiêu cực)... dần dần nhưng chắc chắn biến nó thành cái hố rác không thể sử dụng như ngày nay. Bây giờ chúng ta có AI! Tôi nghĩ một phần lớn tiện ích của nó là nó đưa chúng ta trở lại văn bản/thông tin, và cho phép chúng ta bỏ qua tất cả các thiết kế "đẹp" / những điều vô nghĩa trên tài liệu mà nó được đào tạo. Tuy nhiên, AI chỉ mới bắt đầu chu kỳ "enshittification" của nó - bây giờ nó đã có một lượng người dùng đáng kể, nó là một mục tiêu không thể cưỡng lại để bắt đầu từ từ thêm quảng cáo, thông tin sai lệch, thuyết âm mưu và bất cứ điều gì khác mà mọi người có thể nghĩ ra, cho đến khi nó cũng trở nên không thể sử dụng và chu kỳ lặp lại.
trả lời
realty_geek 1 giờ trước | prev | next [–]
Ví dụ về một trang web có llm.txt tốt là gì?
trả lời
jbrooksuk 1 giờ trước | parent | next [–]
Mintlify tạo ra một tệp llms.txt và llms-full.txt cho tất cả các trang tài liệu. Chúng hoạt động rất hiệu quả: - https://cloud.laravel.com/docs/llms.txt - https://cloud.laravel.com/docs/llms-full.txt
trả lời
skywalqer 46 phút trước | prev | next [–]
Tại sao họ không đặt nó trong .well-known? Ngoài ra, tôi không thể tìm thấy một trang web nào có nó.
trả lời
0123456789ABCDE 12 phút trước | parent | next [–]
https://searchtxt-web.fly.dev
trả lời
mohamedkoubaa 1 giờ trước | prev | next [–]
Nó chỉ là chưa bị lợi dụng thôi.
trả lời
cyanydeez 1 giờ trước | prev | next [–]
Ồ đừng lo, trong 5 năm nữa AI của bạn sẽ bị tràn ngập bởi các lời nhắc "đầu độc ngữ cảnh" (context poison prompts) cố gắng khiến chúng tiêu hết tiền ngân hàng và meta bucks của bạn vào những thứ vô dụng tương tự. Đây chỉ là một phiên bản lặp lại của web thời kỳ đầu.
trả lời
maccam912 26 phút
Nguồn tin: Hacker News LLM — Tác giả: sunshine-o. Bản dịch tiếng Việt do AI thực hiện, có thể có sai sót.