Bạn có biết tỷ lệ ly dị ở bang Maine (Mỹ) có đến 99.26% tương quan với mức sử dụng bơ thực vật bình quân toàn quốc? Nếu bạn vẽ đồ thị của hai hiện tượng này thì sẽ thấy hai đồ thị đó hầu như hoàn toàn giống nhau. Điều này có nghĩa là ăn bơ thực vật sẽ dẫn đến ly dị? Hay ly dị sẽ dẫn đến ăn bơ thực vật? Tất nhiên là cả hai đều không phải — ăn bơ thực vật và ly dị chỉ tương quan với nhau do ngẫu nhiên, chứ mối tương quan này không ám chỉ quan hệ nhân quả.
Nghe thì đơn giản vậy, nhưng việc mặc định rằng tương quan (A liên quan đến B) ám chỉ nhân quả (A gây ra B) là một lỗi ngụy biện logic rất thường gặp. Ví dụ báo chí thường giật tít kiểu như “Ăn nhiều thịt dẫn đến ung thư” hay “Quan hệ giường chiếu thường xuyên giúp bạn trở nên giàu có hơn.” Nếu thích giật tít dựa trên những hiện tượng liên quan cao tới mức đồ thị giống hệt nhau, bạn thậm chí có thể nói “Ăn phô mai nhiều sẽ khiến bạn dễ chết do bị chăn quấn cổ” vì lượng tiêu thụ phô mai và tỉ lệ tử vong do bị chăn quấn cổ khi đang ngủ tương quan với nhau đến 94.71%.
Tương quan giữa tiêu thụ phô mai và chết do quấn chăn. Nguồn: spurious correlations
Nhưng không phải cái gì cũng dễ nhìn ra như vậy. Khi các bác sỹ để ý thấy là phụ nữ tuổi mãn kinh uống thuốc điều hòa nội tiết, họ có tỉ lệ mắc bệnh tim mạch thấp hơn, và thế là các bác sỹ cho rằng thuốc điều hòa nội tiết làm giảm nguy cơ bệnh tim mạch. Nhưng khi nghiên cứu lâm sàng ngẫu nhiên, thì kết quả lại chỉ ra rằng thuốc điều hòa nội tiết làm tăng nguy cơ bệnh tim mạch. Khi phân tích lại những thông tin trước đó, người ta phát hiện ra là những phụ nữ ít mắc bệnh tim mạch kia có mức sống cao hơn, chế độ ăn lành mạnh hơn và tập thể dục thường xuyên hơn — đó mới là các nguyên nhân dẫn tới tỉ lệ bệnh tim mạch giảm trong nhóm này. Đây là một ví dụ về biến ẩn: A không gây ra B, mà là C gây ra cả A và B.

Mặc dù tương quan không thể mặc định là nhân quả, nhưng tương quan vẫn có thể dẫn đường tới nhân quả. Phần lớn các nghiên cứu khoa học là đi tìm mối tương quan, rồi từ đó phân tích để tìm nhân quả. Điều quan trọng là phải nhớ rằng có rất nhiều cách để khiến A và B tương quan với nhau. Ví dụ nếu bạn biết rằng những người cao thường nuôi mèo, thì có thể là:
1. Chiều cao làm tăng khả năng nuôi mèo, hoặc
2. Nuôi mèo làm tăng chiều cao, hoặc
3. Một (hoặc nhiều) biến ẩn dẫn đến cả thay đổi về chiều cao và khả năng nuôi mèo, hoặc
4. Chiều cao và nuôi mèo không có quan hệ nhân quả, chỉ tình cờ tương quan với nhau.
Nếu bạn vẽ tất cả các mối quan hệ nhân quả có thể xảy ra giữa chiều cao, nuôi mèo và chỉ một biến ẩn thôi, bạn sẽ có 20 quan hệ nhân quả khác nhau có khả năng xảy ra!

Thử thách: Bạn có thể vẽ ra 20 mối quan hệ này không?

Khi bạn càng có nhiều thành phần trong một hệ thống, thì mạng lưới nhân quả này càng phức tạp, và để tìm ra cái gì mới là nguyên nhân của cái gì thì thực là đau đầu. Có thể cho một vài ví dụ về hệ thống phức tạp như: bộ não con người, các gen mục tiêu của thuốc điều trị ung thư, hay mạng Internet. Nhưng gần đây, công nghệ đã khiến cho máy tính có thể cùng tương tác với các nhà khoa học để đi mò những mối quan hệ nhân quả có ý nghĩa trong một bể tương quan bao la. Như thế nào? Đọc cùng zeal nhé: 

Thích bài này? Theo dõi Facebook của zeal để đọc ngay khi bài lên sóng nhé. Và đừng quên ghé thăm web nhà zeal để tìm những thử thách xoắn não hơn nữa.


Tham khảo:
1. This ≠ That | AsapSCIENCE
2. Correlation CAN Imply Causation! | Statistics Misconceptions | minutephysics
Ảnh đầu bài: ETSIN