Thế tiến thoái lưỡng nan của người tù (Prisoner’s Dilemma)
Nguồn ảnh: Encyclopedia Brittanica. Thế tiến thoái lưỡng nan của người tù (Prisoner’s Dilemma) là một trò chơi nghiên cứu về sự hợp...

Hình thể đơn giản nhất của trò chơi gồm hai kẻ tình nghi, A và B, bị bắt khi mang súng vào ngân hàng. Cảnh sát không có đủ bằng chứng để kết án họ, nên đã cách ly và gặp từng người một để lấy lời khai với điều kiện:
(1) Nếu hai người đều khai báo, cả hai sẽ nhận kết án với tình tiết giảm nhẹ là 5 năm tù.
(2) Nếu không ai khai nhận, cả hai người sẽ chỉ nhận mức án 1 năm vì tội mang súng trái phép
(3) Nếu một người khai nhận có ý định cướp ngân hàng, còn đồng đảng của anh ta giữ im lặng, người đó sẽ được tự do còn tên đồng đảng sẽ bị kết án và ngồi tù 20 năm.
(2) Nếu không ai khai nhận, cả hai người sẽ chỉ nhận mức án 1 năm vì tội mang súng trái phép
(3) Nếu một người khai nhận có ý định cướp ngân hàng, còn đồng đảng của anh ta giữ im lặng, người đó sẽ được tự do còn tên đồng đảng sẽ bị kết án và ngồi tù 20 năm.
Quy luật của tình thế này rất đơn giản. Mặc dù A không biết chắc chắn B có khai nhận hay không, anh ta nhận định được rằng:
- Nếu tên đồng đảng B im lặng, A cũng im lặng, cả hai cùng chỉ ngồi tù có 1 năm vì mang súng bất hợp pháp. Nếu B im lặng, mà A khai báo, anh ta sẽ được tự do => Đối với A, khai báo là hơn.
- Nếu tên đồng đảng B khai báo, mà A im lặng, rõ ràng rằng anh ta sẽ phải ngồi tù tới 20 năm. Ngược lại, nếu A khai báo, anh ta sẽ hưởng tình tiết giảm nhẹ => Đối với A, khai báo vẫn là hơn.
- Nếu tên đồng đảng B im lặng, A cũng im lặng, cả hai cùng chỉ ngồi tù có 1 năm vì mang súng bất hợp pháp. Nếu B im lặng, mà A khai báo, anh ta sẽ được tự do => Đối với A, khai báo là hơn.
- Nếu tên đồng đảng B khai báo, mà A im lặng, rõ ràng rằng anh ta sẽ phải ngồi tù tới 20 năm. Ngược lại, nếu A khai báo, anh ta sẽ hưởng tình tiết giảm nhẹ => Đối với A, khai báo vẫn là hơn.
Tên B, theo lý trí, cũng nghĩ như vậy. Và thế là cả hai kẻ tình nghi đều chọn khai báo và phải ngồi tù 5 năm vì cướp ngân hàng, và dù đã có tình tiết giảm nhẹ thì cũng vẫn bị ngồi tù lâu hơn tội mang súng trái phép.
Điều châm biếm của tình thế này ở chỗ khi cả hai đối tượng đều hành xử ích kỉ và không chịu thỏa hiệp (tức là lựa chọn khai báo), thì họ sẽ nhận kết quả kém hơn so với khi cả hai bớt vị lợi và chịu hợp tác (là cùng nhất quyết giữ im lặng). Prisoner’s Dilemma là một trò chơi có tổng bằng 0 khi không tìm thấy sự hợp tác giữa những người chơi. Cả 2 sẽ nhận tổng giá trị là 0 nếu đều không hợp tác, nếu một người nhận được +20 thì người kia sẽ nhận được -20. Rõ ràng là nếu trò chơi được chuyển sang tổng khác 0, hợp tác giữa hai người sẽ tạo ra cho mỗi người +5, với tổng giá trị 5 + 5 = 10. Vì lợi ích giữa việc cùng hợp tác (+5) nhỏ hơn việc không hợp tác (+20) nên mỗi người có xu hướng không hợp tác. Đó là sự xung đột giữa lợi ích nhóm và lợi ích cá nhân. Một toàn thể với những cá nhân trục lợi có thể dẫn tới kết quả tồi hơn nhóm khác, hoặc mỗi thành viên sẽ được lợi ít hơn.
Thế lưỡng nan của người tù không phải là một tình thế lý thuyết, mà nó liên quan rất nhiều tới các trường hợp trong giao thiệp giữa người với người trên thực tế. Ví dụ, nếu hai tiệm tạp hóa cùng khởi động một cuộc chiến đại hạ giá, với niềm tin rằng nếu của hàng của họ có giá thấp hơn đối thủ thì sẽ thu hút được lượng khách từ phía bên kia và tăng lợi nhuận. Cả hai bên ra sức giảm giá sản phẩm. Và kết quả, về lâu dài, là sẽ chẳng bên nào thu hút được thêm nhiều khách hàng và cả hai sẽ cùng nhận được ít lợi nhuận hơn.
Năm 1980, Robert Axerold, giáo sư chính trị và chính sách công của Đại học Michigan, đã tổ chức thực hiện 200 trò chơi Prisoner’s Dilemma với 14 nhà kinh tế học và toán học nhằm tìm kiếm một chiến thuật tốt nhất cho mọi trò chơi. Kết quả là chiến thuật đơn giản nhất của giáo sư Anatol Rapoport từ Đại học Toronto, Canada, đã đạt số điểm cao nhất. Chiến thuật đó được gọi là “ăn miếng trả miếng” (Tit For Tat), chỉ gồm 2 quy tắc:
- Lượt đầu tiên chọn hợp tác.
- Các lượt sau chọn như đối thủ đã chọn ở lượt liền kề trước đó.
- Lượt đầu tiên chọn hợp tác.
- Các lượt sau chọn như đối thủ đã chọn ở lượt liền kề trước đó.
Chiến thuật này còn được diễn giải bằng 4 quy tắc nổi tiếng:
- Luôn hợp tác ở những lượt chơi đầu tiên
- Tự vệ nhưng biết tha thứ (không hợp tác nếu đối thủ không hợp tác, hợp tác nếu đối thủ hợp tác)
- Không đố kỵ cho dù người ta giàu có hơn mình (luôn duy trì hợp tác)
- Biết chắc là đối thủ có khả năng hiểu được trò chơi như mình
- Luôn hợp tác ở những lượt chơi đầu tiên
- Tự vệ nhưng biết tha thứ (không hợp tác nếu đối thủ không hợp tác, hợp tác nếu đối thủ hợp tác)
- Không đố kỵ cho dù người ta giàu có hơn mình (luôn duy trì hợp tác)
- Biết chắc là đối thủ có khả năng hiểu được trò chơi như mình
Thích bài này? Hãy theo dõi Facebook của zeal để đọc những bài viết tương tự, và nhớ ghé web nhà zeal để tìm nhiều thử thách xoắn não hơn nữa.
Tham khảo và tổng hợp:
[1] Game Theory, Encyclopedia Britannica
[2] Prisoners’ Dilemma – Hợp tác hay không, Trịnh Minh Giang
[1] Game Theory, Encyclopedia Britannica
[2] Prisoners’ Dilemma – Hợp tác hay không, Trịnh Minh Giang

Khoa học - Công nghệ
/khoa-hoc-cong-nghe
Bài viết nổi bật khác
- Hot nhất
- Mới nhất

duongAQ

Tương tự câu chuyện: Thèm nhậu thì gọi cho A, bảo tao có mồi ngon, mang rượu đến đây. Tiếp theo gọi cho B, bảo tao có rượu ngon, mang mồi đến đây.
=> Nếu A và B cùng hợp tác thì win-win
=> A hoặc B không hợp tác => Lose-Lose
Hồi xưa đi học, lớp có lỗi gì đó đến tai cô chủ nhiệm, câu hỏi cung quen thuộc của cô: "Tôi biết ai gây ra trò này rồi, hãy thành thật khai báo đi" hoặc "Lớp trưởng đã báo tôi biết rồi, ai làm thì hãy nhận đi".
Tất cả đều từ thuyết này mà ra :)))
Cái mình thấy hay nhất khi tìm hiểu chuyện này, đó là làm sao phá vỡ sự hợp tác kia? Nếu ngay từ đầu đã có sự thống nhất hợp tác rồi, làm sao phá vỡ được nó để tìm ra sự thật?
Như vụ án "nữ sinh giao gà", công an đã rất vất vả mới lấy được lời khai đúng. Bởi nhóm tội phạm đó đã bàn bạc thống nhất kế hoạch rồi. Vậy họ đã phá vỡ liên kết đó như thế nào?
- Báo cáo

Anthony
Bằng cách reo nghi ngờ hoặc tăng tỉ lệ win lose. Reo nghi ngờ bằng cách thẩm vấn riêng, ko cho tiếp súc. Tăng tỉ lệ win-lose Như ví dụ song đề tù nhân kia, nếu khai ra mà thằng kia ko khai sẽ đc, bảo vệ ko sợ bị trả thù, còn đút thêm cho tí $, còn nếu cả hai kiên quyết ko khai, thì mức án tù có thể tăng lên, ko chỉ là 1 năm cho mỗi ng mà còn 2 -3 năm. Nếu ko khai mà thằng kia ko khai sẽ bị tù lên 30 năm,etc...
- Báo cáo
MindMovesMatter
Không biết có Nhện nào học ngành quan hệ quốc tế như mình không :)) tình huống tưởng chừng đơn giản này lại là kinh điển của lý thuyết quan hệ quốc tế =)) bản chất của chính trị quốc tế là sự thiếu lòng tin lẫn nhau do các bên không nắm được ý đồ của nhau (uncertainty about future intentions) dẫn đến việc đưa ra quyết định có lợi nhất cho mình.
BTW, Nhện nào là big fan của chủ nghĩa hiện thực tấn công (offensive realism) như mình không

- Báo cáo

Tạ Thắng
- Báo cáo

Alcyone
Trước mình có thấy trang web về chủ đề này giải thích rất hay và rõ, lâu lâu cũng quên rồi
- Báo cáo