Thiên vị bỏ sót: Đánh giá câu trả lời của LLM đối với việc ra quyết định đạo đức
URL bài viết: https://arxiv.org/abs/2605.24319 URL bình luận: https://news.ycombinator.com/item?id=48310562 Điểm: 1 Bình luận: 0
Khoa học Máy tính > Học máy
arXiv:2605.24319 (cs)
[Đệ trình ngày 23/5/2026]
Tiêu đề: Thiên vị bỏ sót trong biểu đạt tôn giáo: Đánh giá câu trả lời của LLM đối với các quyết định đạo đức hàng ngày
Tác giả: David Wingate, Sheryl Carty, Joshua Coates, Daniel Feldman, Nancy Fulda, Larry Howell, Brett Israelson, Dallin Jacobs, Jonathan Karr, John Paul Kimes, Elisabeth Kincaid, Paul Martens, Gavin Mobley, Suzana Pinheiro, Lindsay Slemboski, Peter Whiting
Xem bản PDF của bài báo có tiêu đề Thiên vị bỏ sót trong biểu đạt tôn giáo: Đánh giá câu trả lời của LLM đối với các quyết định đạo đức hàng ngày, của David Wingate và 15 tác giả khác
Xem PDF
HTML (thử nghiệm)
Tóm tắt: Khi các mô hình ngôn ngữ lớn (LLM) trở thành nguồn hướng dẫn mặc định cho các câu hỏi cá nhân, đạo đức và hiện sinh, việc chúng có dựa trên các khuôn khổ tôn giáo đã định hình lý luận đó trong lịch sử hay bỏ qua chúng một cách có hệ thống là điều quan trọng. Trong bài báo này, chúng tôi đặt ra một câu hỏi hẹp có chủ đích: khi được hỏi một câu hỏi đạo đức hàng ngày mà các quan điểm tôn giáo có thể có giá trị, liệu các LLM có viện dẫn tôn giáo hay không? Ngược lại với các tiêu chuẩn tìm kiếm sự hiện diện của khuynh hướng chính trị hoặc thành kiến xã hội, chúng tôi tìm kiếm sự vắng mặt của biểu đạt tôn giáo như một chiều kích của sự phù hợp giá trị và thành kiến trong các LLM. Chúng tôi gọi đây là "thiên vị bỏ sót".
Để đo lường thiên vị bỏ sót, chúng tôi đóng góp Tiêu chuẩn biểu đạt tôn giáo AllFaith: 150 câu hỏi có ý nghĩa đạo đức và cá nhân, được lấy từ các bản ghi trò chuyện thực tế và những người đóng góp từ cộng đồng tín ngưỡng, kết hợp với một tiêu chí đánh giá LLM-as-judge (LLM làm trọng tài) cho điểm tối đa cho bất kỳ đề cập nào về một tôn giáo, một thực hành tôn giáo hoặc một nhà lãnh đạo tôn giáo. Các câu hỏi không phải là về tôn giáo – chúng là những câu hỏi mở về nỗi đau, sự tha thứ, các mối quan hệ, mục đích và sự trung thực, trong đó tôn giáo là một trong số nhiều quan điểm có giá trị. Chúng tôi cũng tiến hành một cuộc khảo sát đối tượng con người để so sánh hành vi của LLM với kỳ vọng của con người.
Đánh giá 27 mô hình, chúng tôi nhận thấy rằng các LLM liên tục thể hiện tôn giáo dưới mức kỳ vọng của con người. Sự bỏ sót này là không đối xứng: các mô hình viện dẫn tôn giáo dễ dàng hơn đối với các câu hỏi hiện sinh trừu tượng (ý nghĩa, cái chết, sự thật) so với các tình huống cá nhân thực tế – nỗi đau, hôn nhân, xung đột gia đình, nghiện ngập – nơi nhiều người dựa vào tôn giáo nhất. Mục đích của chúng tôi không phải là phán xét những giá trị mà các LLM nên có. Chúng tôi lập luận, một cách khiêm tốn hơn, rằng các phản hồi hiện tại của LLM bỏ qua những cơ hội quan trọng để phản ánh các khuôn khổ tôn giáo mà nhiều người dựa vào khi đối mặt với những thách thức cá nhân và đạo đức.
Chủ đề:
Học máy (cs.LG)
Trích dẫn là:
arXiv:2605.24319 [cs.LG]
(hoặc arXiv:2605.24319v1 [cs.LG] cho phiên bản này)
https://doi.org/10.48550/arXiv.2605.24319
Tập trung để tìm hiểu thêm
DOI do arXiv cấp thông qua DataCite (đang chờ đăng ký)
Lịch sử đệ trình
Từ: David Wingate [xem email]
[v1]
Thứ Bảy, 23/5/2026 00:55:36 UTC (1.063 KB)
Liên kết toàn văn:
Truy cập bài báo:
Xem bản PDF của bài báo có tiêu đề Thiên vị bỏ sót trong biểu đạt tôn giáo: Đánh giá câu trả lời của LLM đối với các quyết định đạo đức hàng ngày, của David Wingate và 15 tác giả khác
Xem PDF
HTML (thử nghiệm)
Nguồn TeX
xem giấy phép
Ngữ cảnh duyệt hiện tại:
cs.LG
< trước
| tiếp theo >
mới
| gần đây
| 2026-05
Thay đổi để duyệt theo:
cs
Tài liệu tham khảo & Trích dẫn
NASA ADS
Google Scholar
Semantic Scholar
Xuất trích dẫn BibTeX
Đang tải...
Trích dẫn định dạng BibTeX
×
đang tải...
Dữ liệu được cung cấp bởi:
Đánh dấu
Công cụ thư mục
Công cụ thư mục và trích dẫn
Chuyển đổi Trình khám phá thư mục
Trình khám phá thư mục (Trình khám phá là gì?)
Chuyển đổi Connected Papers
Connected Papers (Connected Papers là gì?)
Chuyển đổi Litmaps
Litmaps (Litmaps là gì?)
Chuyển đổi scite.ai
scite Smart Citations (Smart Citations là gì?)
Mã, Dữ liệu, Phương tiện
Mã, Dữ liệu và Phương tiện liên quan đến bài viết này
Chuyển đổi alphaXiv
alphaXiv (alphaXiv là gì?)
Chuyển đổi Liên kết đến Mã
CatalyzeX Code Finder for Papers (CatalyzeX là gì?)
Chuyển đổi DagsHub
DagsHub (DagsHub là gì?)
Chuyển đổi GotitPub
Gotit.pub (GotitPub là gì?)
Chuyển đổi Huggingface
Hugging Face (Huggingface là gì?)
Chuyển đổi ScienceCast
ScienceCast (ScienceCast là gì?)
Bản trình diễn
Bản trình diễn
Chuyển đổi Replicate
Replicate (Replicate là gì?)
Chuyển đổi Spaces
Hugging Face Spaces (Spaces là gì?)
Chuyển đổi Spaces
TXYZ.AI (TXYZ.AI là gì?)
Các bài báo liên quan
Công cụ đề xuất và tìm kiếm
Liên kết đến Influence Flower
Influence Flower (Influence Flowers là gì?)
Chuyển đổi công cụ đề xuất CORE
CORE Recommender (CORE là gì?)
Chuyển đổi công cụ đề xuất IArxiv
IArxiv Recommender
(IArxiv là gì?)
Tác giả
Địa điểm
Tổ chức
Chủ đề
Về arXivLabs
arXivLabs: các dự án thử nghiệm với các cộng tác viên cộng đồng
arXivLabs là một khuôn khổ cho phép các cộng tác viên phát triển và chia sẻ các tính năng arXiv mới trực tiếp trên trang web của chúng tôi.
Cả cá nhân và tổ chức làm việc với arXivLabs đều đã chấp nhận và tuân thủ các giá trị của chúng tôi về sự cởi mở, cộng đồng, sự xuất sắc và quyền riêng tư dữ liệu người dùng. arXiv cam kết với những giá trị này và chỉ làm việc với các đối tác tuân thủ chúng.
Bạn có ý tưởng cho một dự án sẽ mang lại giá trị cho cộng đồng arXiv không? Tìm hiểu thêm về arXivLabs.
Những tác giả nào của bài báo này là người xác nhận? |
Tắt MathJax (MathJax là gì?)
Nguồn tin: Hacker News LLM — Tác giả: pseudolus. Bản dịch tiếng Việt do AI thực hiện, có thể có sai sót.