Liệu chúng ta có đang bị bẫy với số liệu thống kê?
Số liệu thống kê là một công cụ mạnh mẽ để hiểu các xu hướng, dự đoán và đánh giá giả thuyết. Tuy nhiên số liệu thống kê chưa chắc đã nói lên tất cả trong khi khả năng quyết định của chúng ta rất dễ bị chi phối bởi những số liệu thống kê.
1. Tính trung bình trong thống kê
Nhìn vào bảng dưới mô tả khoảng trung bình dưới đây thì sẽ có 3 loại trung bình: mean, median và mode.
Mean: cộng tất cả các giá trị và chia cho số lượng giá trị
Median : giá trị ở giữa trong mẫu
Mode: giá trị phổ biến nhất trong mẫu.
Vì cách tính và giá trị có thể rất khác nhau dao động khoảng lớn nên thường số liệu khi được công bố sẽ thường được tính toán và ưu tiên chọn những loại có lợi cho nhãn hàng, nhà cung cấp hay phóng viên khi công bố thông tin.
Vì cách tính và giá trị có thể rất khác nhau dao động khoảng lớn nên thường số liệu khi được công bố sẽ thường được tính toán và ưu tiên chọn những loại có lợi cho nhãn hàng, nhà cung cấp hay phóng viên khi công bố thông tin.
2. Tương quan và nhân quả ( Correlation vs Causation)
Tương quan là mối liên hệ giữa hai biến số, nghĩa là khi một biến số thay đổi thì biến số kia cũng thay đổi theo một cách nào đó. Tuy nhiên, việc xác định mối quan hệ tương quan không có nghĩa là một biến số đã gây ra sự thay đổi của biến số kia. Điều này được gọi là hiện tượng tương quan không đi kèm nhân quả.
Đó là những quan niệm cho rằng nếu B xảy ra sau A thì A đã gây ra B. Điều này là sự giả định không có căn cứ rằng do hút thuốc mà điểm số thấp. Liệu nó có thể ngược lại không- điểm số thấp là do hút thuốc?
Một ví dụ khác là tương quan giữa việc ăn bánh kẹo và béo phì. Một số nghiên cứu cho thấy rằng những người ăn nhiều bánh kẹo có xu hướng béo phì hơn. Tuy nhiên, không có chứng cứ rõ ràng cho thấy ăn bánh kẹo gây ra béo phì. Có nhiều yếu tố khác như di truyền, lối sống, chế độ ăn uống chung có thể ảnh hưởng đến béo phì.
Rõ ràng kết luận trên hoàn toàn không có cơ sở vì chúng không loại bỏ được những yếu tố gây nhiễu (confounding factors).
Vì vậy, khi xác định mối quan hệ giữa hai biến số, cần phải cẩn trọng và xem xét kỹ các yếu tố khác có thể ảnh hưởng đến kết quả, và tránh kết luận sai lầm rằng một biến số đã gây ra sự thay đổi của biến số kia.
3. Mẫu không khách quan/ ngẫu nhiên
Một mẫu không khách quan là một mẫu dữ liệu không đại diện cho tổng thể, có thể bị lệch hoặc có sai sót trong cách thu thập dữ liệu. Khi một nghiên cứu sử dụng một mẫu không khách quan, kết quả của nó có thể không chính xác và không thể áp dụng cho toàn bộ tổng thể.
Nhiều kết luận được đưa ra dựa trên một mẫu thống kê rất nhỏ, không ngẫu nhiên và chủ quan.
Để có giá trị, một báo cáo dựa trên mẫu phải sử dụng một mẫu đại diện, trong đó mọi nguồn gốc của sự thiên vị đã được loại bỏ.
Ví dụ về một mẫu không khách quan là khi một nhà sản xuất bán một sản phẩm mới cho một nhóm khách hàng đặc biệt, chẳng hạn như những người yêu thích công nghệ mới. Những người này có thể có ý kiến tích cực về sản phẩm, nhưng không đại diện cho quan điểm của người tiêu dùng trung bình.
4. Tránh bẫy số liệu thống kê
Rất khó để chúng ta tỉnh táo khi đưa ra quyết định dựa trên số liệu thống kê, tuy nhiên việc cân nhắc những yếu tố trên trước một số liệu sẽ giúp chúng ta đưa ra được những lựa chọn đúng đắn hơn mà không bị dính bẫy từ các nhà cung cấp.
Người trong muôn nghề
/nguoi-trong-muon-nghe
Bài viết nổi bật khác
- Hot nhất
- Mới nhất