Thế tiến thoái lưỡng nan của người tù (Prisoner’s Dilemma)
Nguồn ảnh: Encyclopedia Brittanica. Thế tiến thoái lưỡng nan của người tù (Prisoner’s Dilemma) là một trò chơi nghiên cứu về sự hợp...
Thế tiến thoái lưỡng nan của người tù (Prisoner’s Dilemma) là một trò chơi nghiên cứu về sự hợp tác giữa những người trong cuộc, được đưa ra lần đầu bởi nhà toán học người Mỹ Albert W.Tucker.
Hình thể đơn giản nhất của trò chơi gồm hai kẻ tình nghi, A và B, bị bắt khi mang súng vào ngân hàng. Cảnh sát không có đủ bằng chứng để kết án họ, nên đã cách ly và gặp từng người một để lấy lời khai với điều kiện:
(1) Nếu hai người đều khai báo, cả hai sẽ nhận kết án với tình tiết giảm nhẹ là 5 năm tù.
(2) Nếu không ai khai nhận, cả hai người sẽ chỉ nhận mức án 1 năm vì tội mang súng trái phép
(3) Nếu một người khai nhận có ý định cướp ngân hàng, còn đồng đảng của anh ta giữ im lặng, người đó sẽ được tự do còn tên đồng đảng sẽ bị kết án và ngồi tù 20 năm.
(2) Nếu không ai khai nhận, cả hai người sẽ chỉ nhận mức án 1 năm vì tội mang súng trái phép
(3) Nếu một người khai nhận có ý định cướp ngân hàng, còn đồng đảng của anh ta giữ im lặng, người đó sẽ được tự do còn tên đồng đảng sẽ bị kết án và ngồi tù 20 năm.
Quy luật của tình thế này rất đơn giản. Mặc dù A không biết chắc chắn B có khai nhận hay không, anh ta nhận định được rằng:
- Nếu tên đồng đảng B im lặng, A cũng im lặng, cả hai cùng chỉ ngồi tù có 1 năm vì mang súng bất hợp pháp. Nếu B im lặng, mà A khai báo, anh ta sẽ được tự do => Đối với A, khai báo là hơn.
- Nếu tên đồng đảng B khai báo, mà A im lặng, rõ ràng rằng anh ta sẽ phải ngồi tù tới 20 năm. Ngược lại, nếu A khai báo, anh ta sẽ hưởng tình tiết giảm nhẹ => Đối với A, khai báo vẫn là hơn.
- Nếu tên đồng đảng B im lặng, A cũng im lặng, cả hai cùng chỉ ngồi tù có 1 năm vì mang súng bất hợp pháp. Nếu B im lặng, mà A khai báo, anh ta sẽ được tự do => Đối với A, khai báo là hơn.
- Nếu tên đồng đảng B khai báo, mà A im lặng, rõ ràng rằng anh ta sẽ phải ngồi tù tới 20 năm. Ngược lại, nếu A khai báo, anh ta sẽ hưởng tình tiết giảm nhẹ => Đối với A, khai báo vẫn là hơn.
Tên B, theo lý trí, cũng nghĩ như vậy. Và thế là cả hai kẻ tình nghi đều chọn khai báo và phải ngồi tù 5 năm vì cướp ngân hàng, và dù đã có tình tiết giảm nhẹ thì cũng vẫn bị ngồi tù lâu hơn tội mang súng trái phép.
Điều châm biếm của tình thế này ở chỗ khi cả hai đối tượng đều hành xử ích kỉ và không chịu thỏa hiệp (tức là lựa chọn khai báo), thì họ sẽ nhận kết quả kém hơn so với khi cả hai bớt vị lợi và chịu hợp tác (là cùng nhất quyết giữ im lặng). Prisoner’s Dilemma là một trò chơi có tổng bằng 0 khi không tìm thấy sự hợp tác giữa những người chơi. Cả 2 sẽ nhận tổng giá trị là 0 nếu đều không hợp tác, nếu một người nhận được +20 thì người kia sẽ nhận được -20. Rõ ràng là nếu trò chơi được chuyển sang tổng khác 0, hợp tác giữa hai người sẽ tạo ra cho mỗi người +5, với tổng giá trị 5 + 5 = 10. Vì lợi ích giữa việc cùng hợp tác (+5) nhỏ hơn việc không hợp tác (+20) nên mỗi người có xu hướng không hợp tác. Đó là sự xung đột giữa lợi ích nhóm và lợi ích cá nhân. Một toàn thể với những cá nhân trục lợi có thể dẫn tới kết quả tồi hơn nhóm khác, hoặc mỗi thành viên sẽ được lợi ít hơn.
Thế lưỡng nan của người tù không phải là một tình thế lý thuyết, mà nó liên quan rất nhiều tới các trường hợp trong giao thiệp giữa người với người trên thực tế. Ví dụ, nếu hai tiệm tạp hóa cùng khởi động một cuộc chiến đại hạ giá, với niềm tin rằng nếu của hàng của họ có giá thấp hơn đối thủ thì sẽ thu hút được lượng khách từ phía bên kia và tăng lợi nhuận. Cả hai bên ra sức giảm giá sản phẩm. Và kết quả, về lâu dài, là sẽ chẳng bên nào thu hút được thêm nhiều khách hàng và cả hai sẽ cùng nhận được ít lợi nhuận hơn.
Năm 1980, Robert Axerold, giáo sư chính trị và chính sách công của Đại học Michigan, đã tổ chức thực hiện 200 trò chơi Prisoner’s Dilemma với 14 nhà kinh tế học và toán học nhằm tìm kiếm một chiến thuật tốt nhất cho mọi trò chơi. Kết quả là chiến thuật đơn giản nhất của giáo sư Anatol Rapoport từ Đại học Toronto, Canada, đã đạt số điểm cao nhất. Chiến thuật đó được gọi là “ăn miếng trả miếng” (Tit For Tat), chỉ gồm 2 quy tắc:
- Lượt đầu tiên chọn hợp tác.
- Các lượt sau chọn như đối thủ đã chọn ở lượt liền kề trước đó.
- Lượt đầu tiên chọn hợp tác.
- Các lượt sau chọn như đối thủ đã chọn ở lượt liền kề trước đó.
Chiến thuật này còn được diễn giải bằng 4 quy tắc nổi tiếng:
- Luôn hợp tác ở những lượt chơi đầu tiên
- Tự vệ nhưng biết tha thứ (không hợp tác nếu đối thủ không hợp tác, hợp tác nếu đối thủ hợp tác)
- Không đố kỵ cho dù người ta giàu có hơn mình (luôn duy trì hợp tác)
- Biết chắc là đối thủ có khả năng hiểu được trò chơi như mình
- Luôn hợp tác ở những lượt chơi đầu tiên
- Tự vệ nhưng biết tha thứ (không hợp tác nếu đối thủ không hợp tác, hợp tác nếu đối thủ hợp tác)
- Không đố kỵ cho dù người ta giàu có hơn mình (luôn duy trì hợp tác)
- Biết chắc là đối thủ có khả năng hiểu được trò chơi như mình
Thích bài này? Hãy theo dõi Facebook của zeal để đọc những bài viết tương tự, và nhớ ghé web nhà zeal để tìm nhiều thử thách xoắn não hơn nữa.
Tham khảo và tổng hợp:
[1] Game Theory, Encyclopedia Britannica
[2] Prisoners’ Dilemma – Hợp tác hay không, Trịnh Minh Giang
[1] Game Theory, Encyclopedia Britannica
[2] Prisoners’ Dilemma – Hợp tác hay không, Trịnh Minh Giang
Khoa học - Công nghệ
/khoa-hoc-cong-nghe
Bài viết nổi bật khác
- Hot nhất
- Mới nhất