montyhall

I - Nguồn gốc bài toán

Nguồn gốc bài toán là một trò chơi truyền hình thực tế ở Mỹ, người dẫn chương trình cũng chính là người lập nên bài toán này - Monty Hall.
Giả sử bạn đứng trước ba ô cửa mà đằng sau nó là một trong hai thứ: con dê hoặc một chiếc xe hơi giá trị. Bạn mong muốn mở trúng ô cửa có chiếc xe để được nhận nó (nếu mở trúng ô cửa có dê thì bạn phải rinh nó về nhà).
Monty yêu cầu bạn chọn một trong các ô cửa. Dĩ nhiên bạn chọn một cách “hú họa” tại xác suất lúc này để nhận xe hơi ở mỗi ô cửa đều là $latex \frac{1}{3}$. Giả sử bạn chọn ô cửa số 1.
Monty sẽ giúp bạn LOẠI TRỪ 1 ĐÁP ÁN SAI bằng cách mở một ô cửa có dê trong hai ô cửa còn lại (dĩ nhiên ông ta đã biết mỗi ô cửa có gì). Sau đó bạn được lựa chọn LẦN HAI: Giữ nguyên ô cửa ban đầu hay đổi sang ô cửa còn lại chưa được lật mở?
220px-Monty_open_door.svg.png

II - Nhận xét

Thoạt nhìn thì nhiều người tin rằng lựa chọn lần hai có vẻ “thừa thãi” vì xác suất là $latex 50-50$: lựa chọn ban đầu vẫn chưa sai cho đến thời điểm này và dĩ nhiên trong hai ô cửa còn lại, một ô cửa là dê còn ô kia là xe. Tuy nhiên, việc thay đổi quyết định, trong bài toán này, lại có thể tăng xác suất trúng xe của bạn lên gấp đôi, từ $latex \frac{1}{3}$ lên $latex \frac{2}{3}$. Các bạn có thể theo dõi đoạn video dưới đây về các trường hợp có thể xảy ra khi bạn chọn ô cửa số 1:

III - Định lý Bayes

Theo video trên thì nếu bạn đổi, xác suất trúng xe là $latex \frac{2}{3}$. Bài toán trên xuất phát từ nhận xét: xác suất một biến cố thay đổi khi ta thêm điều kiện cho biến cố đó. Như bài toán trên, xác suất mở cửa trúng xe đã thay đổi khi MONTY MỞ CỬA CÓ DÊ. Điều này đã được nhà thống kê học Thomas Bayes nghiên cứu và phát triển thành một định lý mang tên ông.
Theo định lý Bayes, xác suất xảy ra $latex A$ khi biết $latex B$ sẽ phụ thuộc vào 3 yếu tố:
  • Xác suất xảy ra $latex A$ của riêng nó, không quan tâm đến $latex B$ ký hiệu là $latex P(A)$ và đọc là xác suất của $latex A$. Đây được gọi là xác suất biên duyên hay xác suất tiên nghiệm, nó là "tiên nghiệm" theo nghĩa rằng nó không quan tâm đến bất kỳ thông tin nào về $latex B$.
  • Xác suất xảy ra $latex B$ của riêng nó, không quan tâm đến $latex B$. Ký hiệu là $latex P(B)$ và đọc là xác suất của $latex B$. Đại lượng này còn gọi là hằng số chuẩn hóa (normalising constant), vì nó luôn giống nhau, không phụ thuộc vào sự kiện $latex A$ đang muốn biết.
  • Xác suất xảy ra $latex B$ khi biết $latex A$ xảy ra. Ký hiệu là $latex P(B|A)$ và đọc là xác suất của $latex B$ nếu có $latex A$. Đại lượng này gọi là khả năng (likelihood) xảy ra $latex B$ khi biết $latex A$ đã xảy ra. Chú ý không nhầm lẫn giữa khả năng xảy ra $latex B$ khi biết $latex A$ và xác suất xảy ra $latex A$ khi biết $latex B$.
Khi biết ba đại lượng này, xác suất của $latex A$ khi biết $latex B$ cho bởi công thức:
$latex P(A|B)=\dfrac{P(B|A)P(A)}{P(B)}=\dfrac{likelihood\times prior}{normalizing_{constant}}$

IV - Trở lại bài toán

Với bài toán trên, coi như ban đầu ta chọn ô cửa 1. Nếu ta lấy $latex A$ là biến cố chiếc xe ở ô cửa 1 (ô cửa được chọn ban đầu), $latex B$ là biến cố Monty mở cửa số 2. Khi đó:
$latex P(A)=\dfrac{1}{3}.$
Lại có $latex P(B|A)$ là xác suất Monty mở cửa số 2 (biến cố B) khi chiếc xe ở ô cửa số 1 (biến cố A xảy ra). Xác suất này bằng $latex \frac{1}{2}$ do khi đó ông ta sẽ chỉ mở cửa số 2 hoặc số 3.
Xác suất để Monty mở cửa số 2 là $latex P(B)=\frac{1}{2}$. (theo luật ông ta phải mở một trong hai cửa còn lại, khác cửa ta đã chọn).
Thế thì $latex P(A|B)=\frac{1}{3}$, tức xác suất chiếc xe nằm ở ô cửa 1 (biến cố A) khi Monty đã mở ô cửa 2 (biến cố B xảy ra) chỉ là $latex \frac{1}{3}$.
Đặt $latex C$ là biến cố xe nằm ở ô cửa số 3. Ta sẽ tính $latex P(C)$. Ta thấy  và  là hai biến cố xung khắc (do xe chỉ ở ô cửa 1 hoặc ô cửa 3) nên $latex P(C)=1-P(A)=\frac{2}{3}$.
Vậy thực hiện thay đổi ô cửa đã chọn sẽ tăng xác suất trúng xe!
Mở rộng ra, nếu có $latex n$ ô cửa $latex (n\geq 3)$ thì nếu ta chọn trước một ô bất kì, Monty loại cho ta $latex n-2$ đáp án sai trong $latex n-1$ ô cửa còn lại, thì việc đổi ô cửa đã chọn ban đầu sẽ giúp ta tăng xác suất trúng xe lên $latex n-1$ lần.

TÀI LIỆU THAM KHẢO