Hai mẫu giao diện người dùng (UI) của mô hình ngôn ngữ lớn…

URL bài viết: https://poyo.co/note/20260525T094605/ URL bình luận: https://news.ycombinator.com/item?id=48354521 Điểm: 5 Bình luận: 0

Hai mẫu giao diện người dùng LLM không phải Chat Ngày 25/5/2026, 09:46 Bài viết LLM UI Xuất bản Giới thiệu Chat vẫn là giao diện LLM mặc định và trong hầu hết các trường hợp, điều này là phù hợp. Các công cụ tác nhân vẫn được xây dựng dựa trên một cuộc hội thoại tuyến tính duy nhất. Một số tác vụ LLM được thể hiện tốt hơn dưới dạng ngữ cảnh có cấu trúc thay vì tin nhắn. Bài viết này xem xét hai mẫu: so sánh dưới dạng bảng và khám phá dưới dạng cây. Tôi đã đưa vào đây những khám phá của mình, cùng với một số ứng dụng ví dụ trực tiếp mà tôi đã tạo bằng shelley trên exe.dev. So sánh Liên kết: Comparitable Yêu cầu một LLM so sánh các đối tượng trong chat nhanh chóng trở nên tẻ nhạt. Ban đầu, bạn nhận được một bảng khá tốt, nhưng khi bạn đặt các câu hỏi tiếp theo, thông tin hữu ích bị chia nhỏ thành nhiều câu trả lời, hoặc LLM cố gắng vẽ lại bảng mỗi lần. Thêm một mục khác làm cho vấn đề tái tạo trở nên tồi tệ hơn. Bảng đã là thứ bạn muốn, với các mục là hàng, câu hỏi là cột và câu trả lời là ô. Tôi đã khám phá một giao diện chat/bảng lai, nơi các câu hỏi mới tạo ra các cột mới và các mục được thêm vào tạo ra các hàng mới. Trong thực tế, nó giống như trò chuyện với một bảng tính. Xây dựng bảng Sau khi nhập một chủ đề, ứng dụng tìm kiếm các mục liên quan, tìm nạp các trang của chúng và điền vào phiên bản đầu tiên của bảng. Đối với "lều siêu nhẹ 1 người", nó có thể trông như sau: +----------------------+----------+-------+-------------------+ | Mục | Trọng lượng | Giá | Loại tường | +----------------------+----------+-------+-------------------+ | Zpacks Plex Solo | 405 g | 599 USD | DCF một lớp | | Big Agnes Fly Creek | 879 g | 350 USD | Hai lớp | | Tarptent ProTrail Li | 425 g | 399 USD | DCF một lớp | | Nemo Hornet Elite | 765 g | 450 USD | OSMO hai lớp | +----------------------+----------+-------+-------------------+ Ứng dụng hiện sử dụng tìm kiếm Kagi để thu thập các mục, nhưng cách tiếp cận tương tự cũng sẽ hoạt động tốt khi được nhúng vào một trang web mua sắm, thị trường, cơ sở dữ liệu sản phẩm nội bộ, công cụ tuyển dụng hoặc bất kỳ nơi nào khác mà các hàng đã tồn tại. Các cột ban đầu cũng được tạo từ kết quả tìm kiếm đầu tiên. Ứng dụng xem xét các mục đã truy xuất và tự động chọn một vài chiều hữu ích, vì vậy đã có sẵn một cái gì đó trên bảng trước khi người dùng hỏi bất cứ điều gì. Câu hỏi trở thành cột Khi bảng tồn tại, việc nhập một câu hỏi sẽ thêm một cột mới vào đó. Mỗi câu hỏi thêm một chiều so sánh vào cấu trúc hiện có và kết quả có một vị trí cụ thể để hiển thị. Lời gọi mô hình là bình thường: đưa ra các bản tóm tắt mục này, trả lời câu hỏi này cho mỗi hàng. Điều thay đổi là kết quả hiển thị trong cấu trúc bạn đang xây dựng. Việc tạo lời gọi LLM dưới dạng lời gọi công cụ, đặc biệt trả về câu trả lời cho mỗi hàng, cũng phù hợp với thế hệ mô hình hiện tại. Ví dụ nhắc nhở: Lời nhắc của người dùng trông đại khái như sau: Người dùng Bạn đang điền vào một cột trong bảng so sánh. Câu hỏi: "nó có tự đứng được không?" Mục: zpacks-plex-solo: [tóm tắt] big-agnes-fly-creek: [tóm tắt] tarptent-protrail-li: [tóm tắt] nemo-hornet-elite: [tóm tắt] Sử dụng các bản tóm tắt được cung cấp. Trả lời "Không rõ" nếu thông tin không có sẵn. Và định nghĩa công cụ: { "name": "fill_column", "description": "Trả lời câu hỏi so sánh cho từng mục trong bảng.", "input_schema": { "type": "object", "properties": { "answers": { "type": "array", "items": { "type": "object", "properties": { "row_id": { "type": "string" }, "value": { "type": "string" } }, "required": ["row_id", "value"] } } }, "required": ["answers"] } } Hạn chế quan trọng là đơn giản: trả về chính xác một giá trị ô cho mỗi ID hàng. Mô hình điền vào một phần cụ thể của bảng. Không chỉ là thông số kỹ thuật Vì mô hình đang điền các ô, các cột có thể vượt ra ngoài các thông số kỹ thuật có cấu trúc. Dịch thuật là một tác dụng phụ tự nhiên. Nếu trang của một mục bằng tiếng Nhật và tôi muốn bảng bằng tiếng Anh, ô sẽ được điền bằng tiếng Anh mà không cần chế độ dịch riêng. Chuẩn hóa đơn vị cũng tương tự. Nếu tôi hỏi Trọng lượng (g)?, mô hình thường có thể đưa mọi thứ về cùng một đơn vị, giả sử các trang nguồn có đủ thông tin. Các phán đoán mềm cũng hoạt động tốt hơn tôi mong đợi. "Cái này có tốt cho người mới bắt đầu không?" là một câu hỏi so sánh hữu ích mặc dù nó không có một câu trả lời đúng duy nhất, và hầu hết các quyết định mua hàng thực tế đều tương tự. Đối với các câu hỏi cần ngữ cảnh mới hơn, ứng dụng có thể tìm kiếm lại trước khi điền cột. "Reddit nghĩ gì về điều này?" trở thành một cột được hỗ trợ bởi tìm kiếm trực tiếp. Trường hợp so sánh sản phẩm là trường hợp rõ ràng, nhưng cùng một mẫu tương tác có thể áp dụng ở bất cứ đâu bạn đang đánh giá một tập hợp các thứ dựa trên một tập hợp các câu hỏi chung. Phân rã Liên kết: Breakdowner Một số tác vụ yêu cầu khám phá nhiều nhánh ngữ cảnh khác nhau. Điều bắt đầu như một chủ đề tuyến tính thường tạo ra các chủ đề phụ mà mỗi chủ đề đều cần được khám phá tập trung, và trong một giao diện trò chuyện duy nhất, những điều này hòa lẫn vào nhau và làm ô nhiễm ngữ cảnh, khiến việc đi sâu vào bất kỳ chủ đề nào trở nên khó khăn. Hình dạng tự nhiên cho loại công việc này là một cây, trong đó mỗi nhánh kế thừa ngữ cảnh cha của nó nhưng độc lập với các nhánh anh em của nó. Đây là một hình dạng tôi đã sử dụng trước đây khi làm việc với gptel trong Emacs. Một tùy chọn cho phép bạn giới hạn cuộc trò chuyện trong một tiêu đề org-mode. Tôi đã khám phá một trình phác thảo nhỏ và công cụ lập kế hoạch tác vụ trong đó mỗi nút có thể được mở rộng bởi mô hình. Mỗi nhánh có một phần mở rộng tập trung riêng, vì vậy bạn có thể đi sâu vào một chủ đề mà không làm phiền các chủ đề khác. Khám phá cây Mỗi nút có một nút mở rộng gửi tiêu đề hiện tại và một số ngữ cảnh xung quanh đến mô hình, mô hình trả lời theo một trong ba hình dạng. Một phân tích là một vài mục con cụ thể, được chèn làm con. Một câu hỏi có nghĩa là một chi tiết bị thiếu sẽ thay đổi câu trả lời, vì vậy mô hình

Hai mẫu giao diện người dùng (UI) của mô hình ngôn ngữ lớn (LLM) không phải là Chat