Lý thuyết trò chơi: Khi xã hội phải dùng mô hình để thay thế niềm tin

Tôi không viết bài này để phủ định lý thuyết trò chơi. Tôi cũng không viết để tỏ ra “đạo đức hơn” những người làm toán hay kinh tế học.

Tôi viết vì mỗi lần nhìn vào lý thuyết trò chơi, tôi thấy ở đó không chỉ là công thức, mà là dấu vết của một xã hội đã mệt mỏi vì không còn biết tin nhau bằng cách nào khác.

Khi niềm tin không còn đủ bền để làm nền, con người bắt đầu dùng mô hình.

Và khi mô hình trở nên phổ biến, ta gọi nó là khoa học, rồi tưởng rằng vấn đề đã được giải quyết.

Nhưng với tôi, lý thuyết trò chơi giống một bản chẩn đoán hơn là một phương thuốc. Nó không làm xã hội trở nên ích kỷ. Nó chỉ xuất hiện khi xã hội đã đủ nghi ngờ để cần đến nó.

1) Lý thuyết trò chơi không sinh ra từ “chơi”, mà từ một nền văn minh đã đánh mất phản xạ tin người

Nếu con người còn sống trong những cộng đồng nơi lời hứa có trọng lượng, nơi danh dự đủ nặng để kìm hành vi phản bội, nơi kẻ phá vỡ niềm tin bị loại khỏi vòng quan hệ chung, thì không cần lý thuyết trò chơi. Ta chỉ cần chuẩn mực, văn hóa, và ký ức cộng đồng.

Nhưng khi xã hội mở rộng, quan hệ trở nên ẩn danh, tương tác diễn ra giữa những người có thể không bao giờ gặp lại, thì niềm tin không còn là mặc định. Nó trở thành một rủi ro.

Ở điểm đó, con người bắt đầu đặt câu hỏi không còn mang tính đạo đức mà mang tính cấu trúc: “Nếu tôi hợp tác, anh có động cơ gì để không phản tôi?”

Câu hỏi này không xấu. Nó chỉ rất lạnh. Và chính từ cái lạnh đó, lý thuyết trò chơi ra đời như một cách để sống sót trong môi trường mà lòng tốt không còn được bảo hiểm.

2) “Người chơi lý trí” là một giả định tiện lợi, không phải chân dung con người

Lý thuyết trò chơi cổ điển xây dựng trên hình ảnh một người chơi lý trí, luôn tối đa hóa lợi ích của mình. Giả định này đẹp, gọn, và có thể tính được. Nhưng đời sống thật thì không gọn như vậy. Con người không chỉ tối đa hóa lợi ích; họ tối đa hóa cảm giác an toàn, sự đúng đắn trong mắt chính mình, thể diện, và quyền được không cảm thấy mình là kẻ ngu. Có người sẵn sàng thua tiền để giữ sĩ diện. Có người sẵn sàng phá hỏng hợp tác chỉ để trả đũa. Có người chọn một quyết định tệ hơn chỉ vì nó “đúng với tôi hơn”.

Nếu đưa đầy đủ những yếu tố đó vào mô hình, mọi bảng payoff sẽ vỡ tung. Nên ta làm sạch con người, giữ lại một hình nộm lý trí, rồi cho nó chơi. Điều đó không sai, nhưng nó có một hệ quả nguy hiểm: ta bắt đầu nhầm mô hình với thực tại.

Tôi biết ngành này không dừng ở đó. Lý thuyết trò chơi hiện đại và các nhánh hành vi đã thừa nhận con người không thuần lý trí. Nhưng việc thừa nhận không đồng nghĩa với giải pháp. Càng thêm yếu tố tâm lý, mô hình càng phức tạp, khó khái quát, khó dùng. Ở đây có một đánh đổi không tránh khỏi: càng chính xác thì càng mất đi sự thanh lịch. Và rất nhiều hệ thống quyền lực vẫn thích những mô hình gọn gàng hơn là những mô hình trung thực.

3) Trò chơi nguy hiểm nhất không phải là một ván, mà là trò chơi lặp, nơi ký ức trở thành vũ khí

Đời sống thật không diễn ra trong một ván chơi duy nhất. Nó là chuỗi tương tác lặp lại giữa những người không thể hoàn toàn biến mất. Trong trò chơi lặp, ký ức xuất hiện và thay đổi toàn bộ luật. Payoff không còn chỉ là tiền hay lợi ích trước mắt, mà là cách bạn sẽ được nhớ.

Từ đó, con người bắt đầu quản trị hình ảnh của chính mình như một tài sản chiến lược. Hợp tác không còn thuần túy là hợp tác; nó trở thành tín hiệu: “tôi là người có thể tin”. Phản bội không chỉ là lấy lợi ích; nó là chấp nhận bị gắn nhãn. Và vì nhãn đó có tuổi thọ dài, nhiều người vừa hợp tác vừa luôn giữ đường lui. Họ muốn được xem là tử tế, nhưng không muốn trả giá nếu tử tế gặp nhầm người.

4) Xã hội hiện đại và nghịch lý của hợp tác: ai cũng biết điều tốt, nhưng không ai dám tin

Điều bi kịch là: ai cũng hiểu rằng nếu tất cả cùng hợp tác, mọi người đều tốt hơn. Nhưng cũng chính vì hiểu điều đó, ai cũng hiểu phần còn lại: chỉ cần một người phản bội đúng lúc, người đó sẽ thắng lớn. Khi phản bội trở thành cơ hội kinh tế, niềm tin trở thành khoản đầu tư rủi ro.

Thế là mọi người cư xử như thể phản bội là mặc định, không phải vì họ xấu, mà vì họ đang phòng thủ trước một khả năng hợp lý. Ai cũng muốn hợp tác, nhưng ai cũng chờ người khác chứng minh trước. Và khi tất cả cùng chờ, hợp tác trở thành thứ hiếm hoi. Ở đây, vấn đề không còn nằm ở đạo đức cá nhân, mà ở cấu trúc: một cấu trúc có thể khiến hành vi xấu trở nên hợp lý, và hành vi tốt trở nên nguy hiểm nếu làm một mình.

5) Lý thuyết trò chơi gây ra ích kỷ, hay chỉ phơi bày một cấu trúc đã ích kỷ sẵn?

Đây là chỗ tôi không muốn đơn giản hóa. Không rõ lý thuyết trò chơi làm con người ích kỷ hơn, hay nó chỉ mô tả một thế giới vốn đã vận hành như vậy. Có thể những người thích logic phản bội tự tìm đến các mô hình đó. Cũng có thể việc học và dùng các mô hình ấy tạo ra hiệu ứng “mồi”, khiến người ta nhìn mọi tương tác qua lăng kính nghi ngờ. Có lẽ cả hai cùng tồn tại.

Nhưng với tôi, tranh cãi về nhân quả không quan trọng bằng một kết luận lạnh hơn: một xã hội cần đến lý thuyết trò chơi để vận hành đã là một xã hội có vấn đề về niềm tin. Dù mô hình có gây ra hay chỉ phản ánh, việc nó trở nên cần thiết đã nói đủ nhiều.

6) Không phải ai làm kinh tế cũng lạnh lùng, nhưng các ngoại lệ tồn tại vì có vấn đề

Tôi không cho rằng tất cả nhà kinh tế hay nhà lý thuyết đều là những kẻ vô cảm. Có những công trình quan trọng cho thấy cộng đồng có thể tự quản mà không cần cưỡng chế trung ương. Có những nghiên cứu hành vi chứng minh con người không phải cỗ máy tối ưu.

Nhưng tôi nhìn những điều đó như những chỉnh sửa cần thiết đối với một dòng chính đã đi quá xa trong việc đơn giản hóa con người.Các ngoại lệ này tồn tại vì có một vấn đề lớn phía dưới. Chúng không phải là trạng thái mặc định của xã hội hiện đại, mà là những nỗ lực vá lại một cấu trúc đã rạn.

Chúng cho thấy hợp tác là có thể, nhưng thường chỉ bền trong những cộng đồng nhỏ, nơi ký ức chung, chuẩn mực và chế tài xã hội còn đủ mạnh.

7) Điểm mù lớn nhất: mô hình không biết xử lý người từ chối chơi

Có một loại người mà lý thuyết trò chơi rất khó mô hình hóa: người không điều chỉnh hành vi theo lợi ích. Người không phản bội dù phản bội có lợi. Người hợp tác vì giá trị, không vì payoff. Trong hệ thống, những người này thường bị xem là ngây thơ hoặc khó đoán. Nhưng chính sự khó đoán đó mới có khả năng phá vỡ những cân bằng xấu.

Khi một người không chơi theo logic lợi ích, họ trở thành một điểm neo. Và chỉ riêng việc tồn tại của một điểm neo đã làm cho người khác phải suy nghĩ lại. Không phải ai cũng trở nên tốt hơn, nhưng trò chơi không còn chạy trơn tru như trước.

Câu hỏi còn lại sau tất cả mô hình

Lý thuyết trò chơi rất giỏi mô tả thế giới như nó đang vận hành. Nhưng nó không trả lời được câu hỏi mà tôi thấy quan trọng hơn: chúng ta muốn sống trong một thế giới như thế nào?

Một thế giới nơi mọi tương tác đều phải tính toán để không bị phản bội, hay một thế giới nơi có những thứ vẫn tồn tại dù không tối ưu?

Nó cho ta biết rằng trong nhiều cấu trúc, phản bội là nước đi hợp lý. Và chính vì điều đó, ta buộc phải hỏi thêm một câu mà toán không trả lời: khi một hành vi độc trở nên hợp lý, ta có chấp nhận sống trong hệ thống ấy không, hay ta sẽ thay đổi cấu trúc để cái hợp lý bớt độc?

Tôi không kết bài này bằng lời kêu gọi “hãy tử tế”. Tôi chỉ để lại một khoảng trống khó chịu: có thể phần lớn đau khổ của xã hội hiện đại không đến từ việc con người xấu hơn, mà từ việc chúng ta đã tổ chức quá nhiều mối quan hệ theo cách khiến người tử tế phải trả giá như kẻ ngu.

Và nếu một xã hội buộc người tử tế phải chọn giữa “tử tế” và “khôn”, thì dù mô hình có đẹp đến đâu, đó vẫn là một xã hội đáng lo.