
Giải quyết vụ án mạng bằng suy luận Bayes
Bộ phim "Knives Out" đã truyền tải tư duy Bayes như thế nào (mà bạn không hề nhận ra) Bài viết Giải quyết vụ án mạng bằng suy luận Bayes xuất hiện lần đầu trên Towards Data Science.
Thống kê
Giải quyết vụ án mạng bằng suy luận Bayes
Bộ phim "Knives Out" đã dạy bạn tư duy Bayes như thế nào (mà bạn không hề hay biết)
Subha Ganapathi
Ngày 31/5/2026
11 phút đọc
Chia sẻ
Ảnh của Jorge Rosales trên Unsplash
Tổng quan
Tôi nhớ khi xem bộ phim kinh dị bí ẩn "Knives Out" của Hollywood, tôi đã nghiêng người về phía màn hình, như thể vụ án là của mình để phá giải. Khi đội của thám tử Blanc thẩm vấn từng người tại Biệt thự Thrombey, tôi cũng gạch tên trong đầu, chỉ để phục hồi lại sau một hoặc hai tình tiết bất ngờ. Hồi đó, tôi chưa bao giờ nghĩ rằng bộ phim trinh thám kiểu cũ này lại khiến tôi phải tính toán trong đầu. Mặc dù có vẻ hơi cường điệu, nhưng tôi thực sự cảm thấy rằng phong cách điều tra của Benoit Blanc rất giống với suy luận Bayes (Bayesian Inference). Nhưng những ai nhớ các cuộc thẩm vấn trong phim sẽ nhanh chóng nhận ra rằng Benoit Blanc thậm chí không tích cực thẩm vấn. Ông ngồi cạnh một cây đàn piano, để đội của mình (Trung úy Elliot và Hạ sĩ Wagner) đặt câu hỏi. Vậy tại sao tôi lại nói rằng phong cách điều tra của Blanc có liên quan đến suy luận Bayes? Chính Blanc đã đề cập điều này trong phim, và tôi xin trích dẫn:
"Tôi quan sát sự thật mà không có thành kiến của lý trí hay cảm xúc." (Benoit Blanc, Knives Out [1])
Đây chính là bản chất của suy luận Bayes, nơi các kết luận của bạn không bị thúc đẩy bởi trực giác mà bởi bằng chứng. Hãy cùng nhau giải quyết vụ án mạng này bằng suy luận Bayes.
Dưới đây là một lưu ý nhanh trước khi chúng ta bắt đầu. Xuyên suốt bộ phim, các mâu thuẫn được trình bày dưới hai dạng. Có những mâu thuẫn được trình bày dưới dạng hồi tưởng, chỉ được chiếu cho khán giả và hầu hết Blanc không biết. Sau đó, có những mâu thuẫn được tiết lộ bởi những lời khai không nhất quán mà Blanc chứng kiến trong quá trình điều tra. Do đó, chúng ta sẽ chỉ tập trung vào những lời khai không nhất quán mà Blanc ghi nhận.
Ngoài ra, một lưu ý về việc gán và cập nhật trọng số xác suất. Những điều này không được tính toán bằng công thức Bayes, vì các giá trị khả năng (likelihood values) rất khó gán cho các bằng chứng hành vi như hành vi lảng tránh hoặc nói dối. Thay vào đó, chúng ta sử dụng các ước tính có cơ sở làm công cụ giảng dạy chứ không phải là bằng chứng toán học. Vì vậy, hy vọng bạn sẽ thích hành trình này.
Thiết lập bối cảnh – Xác định niềm tin ban đầu
Thám tử Blanc được một thành viên trong gia đình thuê ẩn danh để điều tra khả năng Harlan Thrombey bị sát hại. Khi đội của ông bắt đầu thẩm vấn, Blanc lặng lẽ quan sát các nghi phạm tiềm năng từ phía sau. Khi cuộc thẩm vấn đi chệch hướng, ông điều chỉnh lại đội bằng cách gõ một phím đàn piano.
Ông nhận thấy rằng mỗi tương tác đều bị lẫn lộn bởi những lời nói dối và mâu thuẫn. Điều ông làm đúng là không gạt bỏ một câu chuyện nào là vô căn cứ trong khi giữ lại một câu chuyện khác dựa trên cảm tính. Ông hiểu rằng những lời kể sai lệch có thể chứa đựng những mảnh sự thật. Ông cẩn thận đánh giá từng tương tác, gán trọng số cho từng quan sát, và sau đó kết hợp chúng để đưa ra kết luận. Ông bắt đầu từ sự không chắc chắn nhưng dần dần xây dựng hướng tới sự thật có khả năng nhất, gạt bỏ những thành kiến cá nhân của mình.
Blanc bắt đầu bằng cách liệt kê các nguyên nhân có thể gây ra cái chết. Trong thế giới Bayes, đây được gọi là Mô hình Tiên nghiệm (Prior Model). Mô hình tiên nghiệm là tập hợp các giả định mà chúng ta có trước khi có bất kỳ bằng chứng nào. Trong trường hợp này, mô hình tiên nghiệm là các giả thuyết ban đầu về cái chết của Thrombey trước khi cuộc điều tra bắt đầu.
Ảnh của Aleyna Çatak trên Unsplash; Được chỉnh sửa bởi Tác giả
Đánh giá tính đầy đủ của các giả định ban đầu
Hãy đánh giá các giả định ban đầu để xem liệu chúng ta có bỏ sót khả năng nào khác không. Chúng ta có bỏ qua khả năng đây là một âm mưu gài bẫy ai đó không? Nếu có, liệu điều đó có nên được đưa vào làm giả thuyết thứ sáu không?
Đây là lúc quy tắc quan trọng nhất (Nguyên tắc MECE) để xây dựng giả thuyết trong Suy luận Bayes phát huy tác dụng. Mỗi giả thuyết được xây dựng như một phần của Suy luận Bayes phải Độc lập Tương hỗ và Bao quát Toàn diện (MECE).
Hãy xem xét lại giả thuyết tiềm năng thứ sáu, 'Cố gắng gài bẫy ai đó'. Mặc dù giả thuyết được chọn phải trả lời điều gì có thể đã gây ra cái chết, nhưng giả thuyết tiềm năng này lại nói nhiều hơn về động cơ đằng sau cái chết, với điều kiện nó được chứng minh là một vụ giết người. Vì vậy, nó vi phạm quy tắc độc lập tương hỗ của nguyên tắc MECE và do đó không thể là một giả thuyết trực tiếp.
Gán xác suất (Xác suất tiên nghiệm)
Hãy bám sát các giả thuyết mà chúng ta đã xây dựng trước đó, vì chúng xem xét tất cả các nguyên nhân có thể gây ra cái chết (bao quát toàn diện). Bước hợp lý tiếp theo là gán xác suất cho các giả định ban đầu của chúng ta. Điều này có nghĩa là chúng ta bắt đầu với một phỏng đoán có cơ sở về khả năng mỗi giả thuyết có thể đã gây ra cái chết của Harlan Thrombey. Vì chúng ta gán xác suất trước khi có bất kỳ bằng chứng hoặc dữ liệu trực tiếp nào, chúng ta gọi đây là xác suất tiên nghiệm. Hình ảnh dưới đây cho thấy chúng ta gán trọng số bằng nhau cho tất cả các giả thuyết. Hãy giả sử rằng đây là xác suất tiên nghiệm của chúng ta trong một khoảnh khắc.
Xác suất tiên nghiệm với phân bố đều (Hình ảnh của Tác giả)
Một câu hỏi tự nhiên nảy ra trong đầu chúng ta là liệu mỗi giả thuyết có cùng xác suất xảy ra hay không. Không, không phải lúc nào cũng vậy. Đây là một quan niệm sai lầm phổ biến trong suy luận Bayes rằng chúng ta phải gán xác suất bằng nhau cho tất cả các giả thuyết. Trong trường hợp không có bằng chứng tiên nghiệm, chúng ta giả định rằng Thám tử Blanc gán xác suất bằng nhau cho mỗi giả thuyết. Nhưng điều đó không phải lúc nào cũng đúng.
Chúng ta cũng có thể giả định xác suất không đồng đều nếu chúng ta có kiến thức tiên nghiệm cho thấy một giả thuyết có nhiều khả năng xảy ra hơn các giả thuyết khác. Thống kê tội phạm chung cũng có thể hữu ích để ước tính xác suất tiên nghiệm. Ví dụ, theo dữ liệu giết người của FBI [2], trong hầu hết các vụ giết người, nạn nhân biết kẻ giết người của họ. Các vụ giết người do người ngoài thường đòi hỏi động cơ liên quan đến trộm cắp hoặc một số hình thức trả thù. Do đó, H4 nhận được trọng số lớn hơn, vì các thành viên trong gia đình có khả năng tiếp cận nạn nhân cao hơn. Hơn nữa, trong




Nguồn tin: Towards Data Science — Tác giả: Subha Ganapathi. Bản dịch tiếng Việt do AI thực hiện, có thể có sai sót.