Thám Tử Dữ Liệu: 10 Chiến Lược Để Hiểu Về Số Liệu Thống Kê

Tác giả: Tim Harford

Cắt ngang những lời nói dối và một nửa sự thật; bắt đầu thực sự hiểu các số liệu thống kê.

Bạn có biết câu chuyện về cò trắng đưa những em bé đến với mẹ không? Theo số liệu thống kê đã chứng minh thì: quốc gia nào có số lượng cò cao hơn thì trẻ em được sinh ra nhiều hơn so với những quốc gia có số lượng cò thấp hơn.

Tất nhiên, điều này không đúng bởi cò thì không thể sinh con. Thế nhưng rất dễ làm cho mọi thứ có vẻ giống như vậy, bằng cách sử dụng các đối số thống kê bị lỗi. Việc nói dối bằng các số liệu thống kê đã khiến cho nhiều người dễ dàng tin lầm về chúng.
Thế nhưng điều gì cũng có 2 mặt, nếu không có số liệu thống kê, chúng ta sẽ không thể phát hiện ra rằng hút thuốc lá dễ khiến bạn bị ung thư phổi gấp 16 lần hoặc COVID-19 lây lan từ người này sang người kia.

Bài viết này sẽ mang tới cho bạn 10 chiến lược để hiểu về số liệu thống kê, từ đó bạn có thể sử dụng sự khôn ngoan đối với dữ liệu tốt và tự tin loại bỏ dữ liệu xấu.

Trong bài viết này, bạn sẽ nắm được:

• Một nhà phê bình nghệ thuật nổi tiếng đã bị qua mặt bởi sự giả mạo như thế nào;

• Tại sao tỷ lệ giết người của London lại cao hơn New York; và

• Tại sao các chuyên gia lại là những nhà dự báo khủng khiếp đến như vậy.

1. Hãy lưu ý phản ứng cảm xúc của bạn đối với dữ liệu và thông tin.

Abraham Bredius là nhà phê bình nghệ thuật, nhà sưu tập và chuyên gia nổi tiếng thế giới trong giới họa sĩ Hà Lan. Ông có kiến thức chuyên môn uyên bác, đặc biệt khi nói đến tác giả Johannes Vermeer - bậc thầy hội họa ở thế kỷ XVII, được tôn kính với những tác phẩm như Girl With a Pearl Earring.

Một ngày nọ vào năm 1937, có một luật sư tên là Gerard Boon đã đến tìm thăm Bredius để cho ông xem một bức tranh của Vermeer, được phát hiện gần đây, có tên là Chúa ở Emmaus. Bredius lập tức kinh hãi, ⁠nhưng ông vẫn rất cẩn thận kiểm tra mọi chi tiết trong bức tranh để tìm tất cả các dấu hiệu giả mạo –⁠ và kết quả là ông không tìm thấy dấu hiệu nào.

Bredius tuyên bố bức tranh Emmaus là một tác phẩm chính hiệu của Vermeer, thậm chí là tác phẩm tuyệt vời nhất của ông ấy. Bredius cũng bộc bạch rằng bản thân đã “khó kiểm soát được cảm xúc” khi nhìn thấy bức tranh này. Nhưng thật không may, những cảm xúc dâng trào đó lại khiến ông mắc sai lầm - bởi vì bức tranh Chúa ở Emmaus hoàn toàn là giả mạo.

Emmaus thậm chí không phải là một bức tranh đẹp, nhưng Bredius vẫn bị đánh lừa. Khao khát tin rằng Emmaus là một tác phẩm Vermeer chính hiệu đã dẫn tới việc lý trí bị cảm xúc làm lu mờ. Thật không may, hầu hết mọi người trong số chúng ta đều có thể bị đánh lừa theo cách tương tự khi được cung cấp những thông tin khiến cảm xúc bị xao động.

Nhưng các bạn cũng có thể thấy, một số thống kê không hề gây nên phản ứng cảm xúc - không ai thấy buồn hay vui khi nghe tin: "Sao Hỏa cách Trái Đất hơn 30 dặm." Nhưng những vấn đề khác –⁠ đặc biệt là những vấn đề chính trị thì dễ dàng làm chúng ta phát sinh cảm xúc.

Khi điều đó xảy ra, chúng ta có thể sẽ bỏ qua thông tin nếu thấy không phù hợp với niềm tin mặc định của bản thân. Còn nếu thấy đúng, chúng ta sẽ sử dụng chúng làm dẫn chứng sau này. Người có kiến thức sâu rộng về một chủ đề sẽ dễ khiến cho chúng ta bị tác động –⁠ trên thực tế, một số nghiên cứu đã chỉ ra rằng các chuyên gia rất ít khi thay đổi ý kiến của họ khi đối mặt với các bằng chứng trái ngược nhau. Đó là bởi vì họ vừa giỏi tránh những thông tin gây khó chịu vừa giỏi đưa ra các lập luận theo sở trường của mình.

Vì vậy, ai cũng sẽ bị tác động bởi lý lẽ có động cơ. May mắn thay, làm theo một số quy tắc đơn giản này có thể giúp bạn giảm thiểu khả năng bị tác động.

Bắt đầu bằng việc để ý cảm xúc của mình khi bạn thấy một tuyên bố thống kê. Bạn đang bị xúc phạm, vui mừng quá mức hay bị chối bỏ? Sau khi nhận thấy cảm xúc của mình, hãy tạm dừng lại và tự suy nghĩ xem liệu bạn có đang căng thẳng khi đưa ra một kết luận cụ thể hay không? Cân nhắc những sự thật này sẽ giúp suy nghĩ của bạn trở nên thấu đáo, rõ ràng hơn - không chỉ có vậy, bạn cũng sẽ làm gương cho những người xung quanh về việc cần suy nghĩ chín chắn.

2. Cùng tìm hiểu xem khi nào thì tốt hơn nên tin vào một khẳng định thống kê hoặc trải nghiệm cá nhân.

Khi tác giả nhận được công việc là người dẫn chương trình cho một chương trình radio của đài BBC, ông vô cùng yêu thích công việc này. Chỉ có điều, ông không thích chuyến đi làm buổi sáng từ Đông London sang Tây London. Bởi ông phải ngồi trên một chiếc xe buýt đông đúc và sau đó xuống tầng hầm - bước lên một chuyến tàu điện ngầm chen chúc đến nghẹt thở.

Chính vì những buổi sáng khốn khổ đó, tác giả muốn tìm hiểu thêm về hệ thống giao thông công cộng của London thực sự bận rộn như thế nào. Ông ấy đã bị sốc khi biết rằng sức chứa trung bình của một chiếc xe buýt ở London chỉ là 12 người, và trên tàu điện ngầm là dưới 130 người.

Những số liệu thống kê đó không hề đúng; chúng hoàn toàn mâu thuẫn với trải nghiệm cá nhân của tác giả. Chuyện gì đã xảy ra?

Chúng ta biết rằng niềm tin và cảm xúc đôi khi có thể khiến nhận thức của chúng ta bị sai lệch khi đứng trước một công bố thống kê. Nhưng đôi khi, trải nghiệm cá nhân có thể mang lại nhiều thông tin như số liệu thống kê mang lại. Điều quan trọng là tìm ra sự cân bằng giữa hai điều này.

Hãy bắt đầu với việc phân tích chất lượng của chính công bố thống kê bằng cách xác định nguồn gốc của nó. Trong trường hợp giao thông công cộng ở London, các con số đến từ một tổ chức chính phủ có tên là Giao thông vận tải tại London (TFL), tổ chức này chuyên thu thập dữ liệu từ những người sử dụng thẻ thanh toán trước khi lên tàu.

Vậy thì, nguồn gốc của dữ liệu ở đây có vẻ đáng tin cậy. Tiếp theo, chúng ta nên xem xem tại sao trải nghiệm cá nhân của tác giả lại khác so với số liệu thống kê.

Ở đây, các con số tính toán trung bình có liên quan tới nhau. Giả sử có một tuyến xe lửa với 10 chuyến tàu mỗi ngày. Một trong những chuyến tàu đó chở 1000 hành khách, trong khi 9 chuyến còn lại không chở ai. Sức chứa trung bình cho mỗi chuyến tàu trên tuyến đó sẽ là 100 người –⁠ khá gần với mức trung bình thực tế ở London. Vì vậy, số liệu thống kê của TFL không hề nói dối –⁠ nhưng họ không hề đề cập gì đến trải nghiệm cá nhân của những người trên những chuyến tàu chật chội đó.

Trong trường hợp này, số liệu thống kê và kinh nghiệm cá nhân đều có giá trị thông tin như nhau. Nhưng tại một số thời điểm thì cái này hoặc cái kia sẽ mang lại hiệu quả hơn.

Thông thường, số liệu thống kê sẽ dành chiến thắng khi nói tới các vấn đề liên quan đến sức khỏe, vì nó cho thấy kết quả có thể xảy ra nhất đối với nhiều người nhất. Ví dụ, hút thuốc lá khiến bạn có nguy cơ mắc ung thư phổi cao gấp 16 lần, ngay cả khi bạn có một người bà 90 tuổi vẫn hút thuốc lá và khỏe mạnh bình thường.

Nhưng ngược lại, số liệu thống kê cũng có thể nói dối, đặc biệt khi nói đến những vấn đề như đánh giá hiệu suất. Người ta có nhiều khả năng thao túng, giả mạo hoặc bóp méo dữ liệu khi lợi ích vật chất hoặc nghề nghiệp của họ bị đe dọa. Vì vậy khi đánh giá hiệu suất, ta nên dựa theo từng trường hợp mà tiến hành.

Sự hiểu biết thực sự đến từ việc biết khi nào dùng số liệu thống kê, khi nào dùng kinh nghiệm cá nhân hoặc khi nào kết hợp cả hai là phù hợp nhất.

3. Cẩn thận xem xét những gì mà thống kê thực sự đang đo lường.

Vào cuối những năm 2010, Vương quốc Anh dường như đang ở giữa cuộc khủng hoảng tử vong ở trẻ sơ sinh. Tỷ lệ tử vong về cơ bản khác nhau trên toàn quốc - lúc đầu, không ai rõ tại sao.

Hóa ra là do sự khác biệt về định nghĩa của cụm từ "tỷ lệ tử vong" - cụ thể là cho dù trẻ sinh ra ở tuần thứ 22 hay 23 thì cũng sẽ được ghi nhận là hư thai hoặc sinh ra, sau đó chết yểu. Ở London, những ca mang thai dạng như thế được ghi nhận là hư/ sảy thai. Ngược lại, ở vùng Trung du nước Anh, chúng được coi là những đứa bé đã có hình hài. Sự khác biệt trong định nghĩa này đủ để giải thích khoảng cách về tỷ lệ tử vong tại các bệnh viện ở London và những vùng trung du nước Anh.

Câu chuyện này cho ta thấy tầm quan trọng khi ta bóc tách một tuyên bố đang đang thực sự đề cập tới vấn đề gì, chứ không chỉ là dựa vào vẻ bề ngoài của nó.

Đo lường bất kể thứ gì, chẳng hạn như tỷ lệ tử vong ở trẻ sơ sinh, nhìn bề ngoài thì có vẻ đơn giản: chỉ cần đếm số lượng trẻ sơ sinh không qua khỏi. Nhưng đi sâu hơn một chút, bạn sẽ thấy câu chuyện trở nên phức tạp vì sự khác biệt giữa một bào thai và một em bé thường gây ra nhiều tranh cãi.

Điều này thực sự có ảnh hưởng đến lĩnh vực thống kê, về bản chất, tất cả đều liên quan đến việc đo lường hoặc đong đếm. Tuy nhiên, khi chúng ta nhìn thấy một thống kê, chúng ta hiếm khi đặt câu hỏi chính xác cái gì hoặc ai đang được thống kê.

Hãy xem xét một nhận định sau: "Trẻ em thường xuyên chơi trò chơi điện tử mang tính bạo lực, thì ở ngoài đời cũng sẽ có xu hướng trở nên bạo lực." Thật mơ hồ với nhận định trên bởi chúng ta không biết nó đang đo lường điều gì.

Ví dụ: Thế nào thì được tính là trò chơi điện tử mang tính bạo lực? Đánh giá mức độ thường xuyên khi chơi trò chơi điện tử của trẻ là như thế nào? Và chính xác thì các nhà nghiên cứu đã đo lường bạo lực bằng cách nào?

Sự hời hợt của những định nghĩa có thể trở thành bàn đạp của những người mang trong mình mục đích bóp méo sự thật - như thúc đẩy một quan điểm chính trị nào đó chẳng hạn.

Ví dụ: Hãy xem một chính sách đề xuất cho việc "đóng băng 5 năm đối với lao động nhập cư không có tay nghề", được công bố bởi một nhóm vận động hành lang Brexit vào năm 2017. Nhưng chính xác thì "không có tay nghề" nghĩa là gì? Trong trường hợp này, thuật ngữ này bao gồm bất kỳ ai có mức lương thấp hơn 35.000 bảng Anh. Điều đó sẽ ngăn cản việc nhập cư đối với hầu hết các y tá, giáo viên tiểu học, trợ lý pháp lý và dược sĩ. Nghe xong, bạn vẫn có thể ủng hộ hoặc phản đối chính sách, nhưng chắc chắn nó sẽ giúp bạn biết chính xác ai đang được coi là lao động "không có tay nghề" trong chính sách này.

Vì vậy, hãy nhớ đặt câu hỏi về các định nghĩa được sử dụng trong một nhận định nào đó trước khi bạn chấp nhận hoặc bác bỏ nó. Và nếu bạn thấy một tuyên bố/ khẳng định như "sự bất bình đẳng đang tăng lên", thì trước tiên hãy đặt câu hỏi: Bất bình đẳng về cái gì?

4. Đặt lời khẳng định vào ngữ cảnh trước khi đưa ra kết luận.

Vào tháng 4/2018, những tiêu đề giật gân, đáng báo động xuất hiện tràn lan trên các tờ báo của London. Tất cả đều hướng tới ý: “Lần đầu tiên trong lịch sử, tỷ lệ giết người ở London cao hơn ở New York!”

Bỏ qua thực tế rằng định nghĩa về "giết người" ở mỗi thành phố là khác nhau, khẳng định trên về mặt giấy tờ là đúng. Vào tháng 2/2018, có 14 vụ giết người ở Thành phố New York, trong khi ở London có 15 vụ.

Chúng ta có thể rút ra kết luận gì từ thống kê này? Thực sự là không có gì cả. Chỉ những con số thôi không cho chúng ta biết thêm nhiều điều. Để thực sự hiểu những gì đang diễn ra trên thế giới, chúng ta cần xem xét các thông tin, dữ liệu trong bối cảnh và bức tranh tổng quát.

Hãy ngược dòng thời gian và nhìn lại một số sự thật về các vụ giết người ở London so với New York. Năm 1990, London có 184 vụ giết người; New York gấp hơn 10 lần con số đó, cụ thể là ở mức 2.262. Kể từ đó, tỷ lệ giết người đã giảm ở cả hai thành phố. Năm 2017, London có tổng cộng 130 vụ giết người, ở New York có 292 vụ giết người - đây quả là một cải thiện đáng kể.

Khi đã nắm được bối cảnh, chúng ta bắt đầu hiểu tình hình thực tế hơn. Bởi vì New York hiện tại an toàn hơn nhiều, nên tỷ lệ giết người tại đây sẽ có lúc giảm xuống dưới mức so với London. Còn London thì không đột nhiên rơi vào tình trạng hỗn loạn do băng đảng, tội phạm hoành hành. Trên thực tế, cả hai thành phố đều an toàn hơn trước đây!

Thật không may, truyền thông thì ưu tiên những tin tức tức thời, mang tính thời sự, và chính điều này đã che mất những góc khuất khác trong bức tranh bối cảnh rộng lớn.

Không chỉ có việc nhìn vào các khoảng thời gian rộng giúp bạn hiểu ý nghĩa thực sự của một thống kê, mà cả các thang số tổng quát cũng đem lại nhiều thông tin hữu ích.

Ví dụ, hãy xem xét chi phí của bức tường biên giới mà Donald Trump muốn xây dựng giữa Mỹ và Mexico: 25 tỷ đô la. Nhìn bề ngoài, con số đó có vẻ rất lớn. Nhưng nếu so sánh với toàn bộ ngân sách quốc phòng của Mỹ chỉ dưới 700 tỷ USD/năm (tức khoảng 2 tỷ USD một ngày), thì bạn sẽ thấy, việc xây dựng bức tường chỉ tốn bằng khoảng hai tuần cho các hoạt động quân sự của Mỹ.

Tất nhiên, bạn vẫn có thể cho rằng chi phí của bức tường hoặc tỷ lệ giết người ở London là những số đáng báo động. Song hiểu được bối cảnh đầy đủ sẽ làm cho ý kiến của bạn được thông suốt, cặn kẽ hơn rất nhiều.

5. Ngay cả nghiên cứu khoa học cũng có thể bị tác động bởi khuynh hướng.

Bạn đã nghe về thí nghiệm nếm mứt nổi tiếng do nhà tâm lý học Sheena Iyengar và Mark Lepper thực hiện chưa? Tại đó, các nhà nghiên cứu đã thiết kế một gian hàng nếm thử mứt, một thời điểm cung cấp 24 loại mứt và thời điểm khác thì cung cấp 6 loại. Sau khi khách hàng nếm thử mứt, họ sẽ được tặng một phiếu mua hàng với giá ưu đãi. Cuối cùng, gian hàng trưng bày lớn hơn (24 loại mứt) đã thu hút nhiều khách hàng hơn - nhưng chỉ có 3% trong số họ mua mứt. Trong khi đó, 30% khách hàng đã mua mứt ở gian hàng trưng bày nhỏ hơn (6 loại mứt). Các nhà tâm lý học kết luận rằng mọi người phản ứng tốt hơn với ít lựa chọn hơn và tệ hơn với nhiều lựa chọn hơn.

Kể từ khi được công bố, nghiên cứu trở nên rất phổ biến. Bạn có thể tìm thấy kết quả này ở khắp mọi nơi, từ các bài báo tâm lý học đại chúng cho đến các bài TED Talks. Nhưng liệu kết quả đó có nên tin không?

Thực ra, nghiên cứu về sự lựa chọn khác khó kết luận hơn nhiều so với thí nghiệm chọn mứt ban đầu đưa ra. Những tờ báo xuất bản về chủ đề này nhiều khả năng thấy rằng việc đưa ra nhiều lựa chọn sẽ có ảnh hưởng lớn, nhưng nó có thể là ảnh hưởng rất tích cực hoặc rất tiêu cực. Còn những tờ báo không xuất bản có nhiều khả năng không thấy các thí nghiệm về lựa chọn có tác động gì.

So với tin tức thì các ấn phẩm học thuật cũng dễ bị ảnh hưởng bởi những định kiến nhất định.

Mỗi một ví dụ là một sự định hướng xuất bản, trong đó nói rằng báo chí sẽ công bố các thí nghiệm với kết quả đáng kinh ngạc hoặc phản trực giác hơn so với những thí nghiệm có kết quả chưa đi đến đâu. Rốt cuộc thì, không ai muốn đọc một nghiên cứu với kết quả buồn tẻ, nhàm chán.

Không chỉ có thế, nghề nghiệp và thu nhập của nhiều nhà nghiên cứu gắn liền với khả năng thực hiện và xuất bản nghiên cứu của họ. Chính điều này tạo ra các động cơ gian dối để họ thao túng dữ liệu, họ sẽ làm cho con số có vẻ quan trọng hơn thực tế. Kết quả là, các ngành khoa học xã hội đang phải đối mặt với một "cuộc khủng hoảng sao chép."

Cho đến khi vấn đề này được giải quyết, bạn nên xem xét mức độ đáng tin cậy của một nghiên cứu trước khi bạn giới thiệu, chia sẻ kết quả đó. Đầu tiên, hãy tìm hiểu xem liệu nghiên cứu có ý nghĩa trực quan hay bạn cảm thấy nó lạ lẫm. Sau đó, kiểm tra xem liệu có nhiều nghiên cứu khác đưa ra kết luận tương tự hay không. Chỉ những bước đơn giản này có thể giúp bạn tránh phát tán thông tin sai lệch.

6. Số liệu thống kê và dữ liệu không phải lúc nào cũng áp dụng được cho tất cả mọi người.

Mọi người cảm thấy áp lực như thế nào để trở thành người phù hợp với đồng nghiệp của mình? Nhiều nghiên cứu đã cho thấy câu trả lời là: rất lớn.

Vào những năm 1950, Nhà tâm lý học Solomon Asch đã tiến hành một nghiên cứu, tại đó ông cho các đối tượng tham gia xem 2 hình ảnh. Một hình ảnh là 3 dòng mô tả với độ dài khác nhau; hình ảnh còn lại là 1 dòng mô tả tham chiếu (mẫu).

Nhiệm vụ của họ đơn giản là xác định dòng nào trong số 3 dòng đưa ra có cùng độ dài với dòng tham chiếu.

Thế nhưng cái khó ở đây, đó chính là xung quanh những người tham gia, có những người chương trình gài vào sẵn để khiến người tham gia chọn sai dòng. Trong một thời gian đáng kể, người tham gia đưa ra những lựa chọn bị tác động bởi lỗi sai của những người được gài cắm.

Thực nghiệm tâm lý này rất nhẹ nhàng và thú vị, nhưng chúng ta không thể vội kết luận rằng Asch đã khai phá ra sự thật phổ quát về bản chất con người. Bởi vì nghiên cứu của ông bị giới hạn trong một nhóm người cụ thể: họ là những nam sinh viên da trắng theo học tại đại học Mỹ những năm 1950.

Gần đây, những nhà tâm lý học dần nhận thấy vấn đề là nhiều cuộc thí nghiệm đã giới hạn nghiên cứu của họ vào những nhóm người cụ thể. Đặc biệt, những thí nghiệm có xu hướng được áp dụng ở những đối tượng được xem là "WEIRD" - một từ viết tắt của những nền dân chủ công nghiệp hoá giàu có ở phương tây, thừa hưởng nền giáo dục tiên tiến.

Vậy điều đó có nghĩa là những kết uận của Asch không chính xác chăng? Vào năm 1996, thí nghiệm của ông đã truyền cảm hứng cho 133 thí nghiệm tâm lý sau đó - và kết quả nói chung vẫn là như thế. Hầu hết những thí nghiệm theo sau không có gì đa dạng, nhưng chúng cũng cho thấy những tác động thú vị. Chẳng hạn như, mọi người có khả năng trở thành người phù hợp với nhóm bạn của mình hơn là với những người lạ, và những nhóm nữ giới có nhiều khả năng trở thành người phù hợp hơn so với nhóm nam giới.

Thực ra không khó để lấy được một mẫu đối tượng đại diện khi tiến hành nghiên cứu học thuật. Nhưng việc lấy dữ liệu đại diện ở các lĩnh vực khác thì khó hơn nhiều, đặc biệt là thăm dò ý kiến.

Vấn đề chính đối với thăm dò ý kiến đó là việc lấy mẫu bị thiên lệch hoặc một số người thích trả lời phiếu hơn những người khác. Một vấn đề khác nữa đó là khu vực cụ thể - nơi mà dữ liệu được rút ra. Ví dụ, một cuộc thăm dò ý kiến của người dùng Twitter tại Mỹ có thể đại diện cho chủ yếu những người trẻ tuổi, có trình độ đại học, họ chính là những đối tượng sử dụng nền tảng này nhiều hơn những đối tượng khác.

Hãy ghi nhớ điều này khi bạn bắt gặp một phần dữ liệu, và luôn đặt ra câu hỏi cho bản thân: Ai có thể bị thiếu trong mẫu hỏi này? Cố gắng hết sức để tra cứu - bởi vì rất có thể bạn sẽ tìm thấy điểm mù.

7. Duy trì thái độ hoài nghi lành mạnh đối với các thuật toán và dữ liệu lớn.

Khi được phát hành vào năm 2009, Google xu hướng "dịch cúm" được xem như một công cụ cải cách trong việc theo dõi sự lây lan của bệnh cúm mùa. Bằng việc đếm số lượt tìm kiếm từ khoá :"Các triệu chứng cảm cúm" và "Các hiệu thuốc ở gần tôi", Google có thể ước lượng chính xác những trường hợp cảm cúm mới hằng ngày nhanh hơn cả CDC.

Bằng nhiều cách, Google xu hướng "dịch cúm" đã báo trước cho nhân loại một kỷ nguyên mới: đó là "Big Data" và "thuật toán". Big Data liên quan tới những thông tin chúng ta tạo ra khi lướt web, thanh toán bằng thẻ tín dụng hoặc sử dụng điện thoại di động. Thuật toán là chương trình máy tính thường được sử dụng để tìm các hình mẫu trong tập dữ liệu.

Google xu hướng "dịch cúm" đã sử dụng Big Data và các thuật toán để⁠ tạo ra dữ liệu hay ho về xu hướng dịch cúm. Vậy mà chỉ 4 năm sau khi dự án được công bố, nó đã sụp đổ hoàn toàn. Tại sao?

Google Xu hướng "Dịch cúm" đã thất bại thảm hại, vào một mùa đông, nó cho biết có một đợt bùng phát dịch cúm nghiêm trọng trong khi không có một đợt bùng phát nào. Có thời điểm, Google xu hướng ước tính rằng sự lây lan của bệnh cúm còn tồi tệ hơn gấp hai lần so với dữ liệu chính thức của CDC.

Vậy vấn đề ở đây là gì? Trên thực tế, Google không biết mối liên quan giữa cụm từ tìm kiếm và sự lây lan của bệnh cúm là gì. Thuật toán mải mê tìm kiếm các hình mẫu trong dữ liệu, nhưng nó tìm thấy các kết nối chẳng liên quan gì đến bệnh cúm, chẳng hạn như “bóng rổ trung học”. Kết quả là, thuật toán trở thành một máy dò dịch cúm thì ít, mà dò hoạt động cho mùa đông thì nhiều. Điều đó có nghĩa là nó không thể phát hiện một đợt cúm bùng phát vào mùa hè năm 2009.

Tất nhiên, đôi lúc có những trường hợp mà thuật toán làm việc đáng tin hơn những ước tính do con người tạo ra. Ví dụ, có rất nhiều bằng chứng cho thấy rằng những người thẩm phán không hoàn toàn khách quan cũng như nhất quán khi đưa ra các bản án hình sự. Trong khi đó, các thuật toán đưa ra các bản án công bằng hơn nhiều bằng cách so sánh sự vụ này với các sự vụ tương tự trong quá khứ.

Đôi khi các thuật toán sẽ tạo ra kết quả chính xác, chất lượng nhưng đôi khi lại không. Do đó, chúng ta cần đánh giá từng thuật toán trên cơ sở từng trường hợp cụ thể và không coi độ chính xác của nó như một giá trị nhất định.

Để làm được điều này không hề dễ dàng vì nhiều công ty không muốn tiết lộ bí mật đằng sau động cơ kiếm tiền của họ. Nhưng nếu mọi người đều được phép ngang hàng dưới tác động của một thuật toán, chúng ta sẽ dễ hiểu được cách các công ty đưa ra quyết định như thế nào⁠ và họ cải biến ra sao.

8. Đừng bỏ qua tầm quan trọng và tính hữu ích của số liệu thống kê chính thức.

Năm 1974, văn phòng Ngân sách Quốc hội (CBO) được thành lập ở Mỹ nhằm cung cấp cho Quốc hội các báo cáo về chi phí ngân sách của các chính sách đề xuất. Như một quan chức của CBO đã mô tả, quá trình này giống như thả một hóa đơn xuống hố ga và sau đó ước tính chi phí được gửi lại 20 phút sau –⁠ khách quan và không ai bàn cãi.

Nhưng không phải tổng thống nào cũng chấp nhận ước tính của CBO với một thái độ vui vẻ. Tổng thống đầu tiên phàn nàn là Jimmy Carter, người muốn cải thiện hiệu quả năng lượng của Mỹ. Nhưng sau khi đánh giá các đề xuất thực hiện điều này của Carter, CBO nhận thấy chúng sẽ không hoạt động tốt như kế hoạch đề ra. Chính quyền Carter không hài lòng vì cho rằng CBO "không giúp ích được gì." Đây chính là điểm then chốt - các tổ chức chính phủ hiệu quả nhất sẽ trình bày được các số liệu thống kê một cách chính xác, cho dù họ có làm cho các chính trị gia hài lòng hay không.

Khi các chính trị gia có ý định bóp méo hoặc làm mất uy tín của các cơ quan thống kê, thảm họa có thể xảy đến.

Chỉ cần lấy ví dụ về Hy Lạp, vào đầu những năm 2000, đây là quốc gia có số liệu thống kê không đáng tin cậy như họ đã đưa ra. Để tiếp tục nằm trong khu vực đồng tiền chung châu Âu, một quốc gia phải giữ cho thâm hụt ngân sách của nước mình dưới 3% GDP. Hy Lạp không thể làm điều đó một cách hợp pháp, vì vậy các quan chức quyết định điều chỉnh các con số một chút, họ gạt bỏ ra vài tỷ euro mà đất nước này đã vay ra khỏi báo cáo.

Sự lấp lửng về con số này càng trở nên rõ ràng vào năm 2009. Giữa cuộc khủng hoảng tài chính toàn cầu, EU nhận ra rằng Hy Lạp đã vay nhiều tiền hơn những gì họ thừa nhận, không chỉ có vậy: Hy Lạp còn không có khả năng trả nợ. Nền kinh tế Hy Lạp nhanh chóng sụp đổ và thất bại thảm hại.

Các cơ quan thống kê độc lập không chỉ giữ cho một quốc gia luôn trung thực, mà họ còn mang lại nhiều giá trị khác.

Ví dụ, một phân tích chi phí - lợi ích được thực hiện ở Anh cho thấy dữ liệu từ cuộc điều tra dân số quốc gia là công cụ hỗ trợ mọi việc, từ chính sách lương hưu đến xây dựng trường học và bệnh viện ở những khu vực phù hợp. Ngoài ra, nó cho phép các tổ chức khác tính toán tất cả các loại thống kê bình quân đầu người.

Thật không may, phân tích không thể tạo một giá trị cho tất cả phép tính thống kê, nhưng ước tính của nó - một giá trị khá dè dặt - chỉ ra rằng những lợi ích có thể đo lường được tổng cộng là 500 triệu bảng/năm. Bản thân cuộc điều tra dân số có chi phí thấp hơn con số đó và áp dụng trong mười năm, dẫn đến lợi nhuận trên mức đầu tư ban đầu gấp mười lần. Nếu các chính phủ dự kiến sẽ hành động để giải quyết các vấn đề, thì họ cần một cơ sở thống kê vững chắc để từ đó tiến hành thực hiện điều này.

9. Đừng để bị đánh lừa bởi tính thẩm mỹ bóng bẩy của một đồ thị hoặc biểu đồ.

David McCandless, tác giả cuốn Information is Beautiful, từng sản xuất một video hoạt hoạ nổi tiếng và khó quên mang tên Debtris. Cũng giống như trò chơi điện tử cổ điển Tetris, Debtris hiển thị các khối màu lớn rơi xuống cuối màn hình. Quy mô của mỗi khối đại diện cho chi phí của các mặt hàng khác nhau, như ngân sách của Liên Hợp Quốc, chi phí ước tính của cuộc chiến tranh Iraq năm 2003 và doanh thu của Walmart.

Âm nhạc hấp dẫn, đồ họa đầy màu sắc và sự trình bày chậm rãi của các so sánh rất bắt mắt. Nhưng đáng tiếc là, những yếu tố đó đã che khuất nhiều vấn đề trong dữ liệu, thứ được sử dụng để tạo ra đồ họa.

Đôi khi, sự hiển thị của một thống kê thì hấp dẫn đó nhưng dữ liệu đằng sau nó lại thật xấu xí. Không may, đó chính là trường hợp Debtris, một thống kê mắc nhiều sai lầm. Chẳng hạn như, nó kết hợp thước đo ròng với thước đo tổng. Điều này giống như so sánh lợi nhuận của một công ty với doanh thu của công ty vậy.

Còn các vấn đề khác bên trong Debtris thì sao, chúng ta có nên loại bỏ bất kỳ nỗ lực nào trong việc trình bày dữ liệu một cách đẹp mắt không? Không cần thiết. Đôi khi, ai đó có thể gãi đúng chỗ ngứa của người xem khi vừa bảo đảm hài hoà được nội dung thông tin lẫn hình thức trình bày. Minh chứng cho điều này chính là Florence Nightingale, một nhân vật huyền thoại ngày nay được biết đến như là người sáng lập ra ngành điều dưỡng hiện đại.

Ít được biết đến hơn –⁠ nhưng không kém phần ấn tượng –⁠ là công việc của Nightingale với tư cách là một nhà thống kê. Năm 1858, bà bắt đầu lưu hành một thứ gọi là sơ đồ hoa hồng, với mục tiêu chứng minh rằng các biện pháp vệ sinh có thể làm giảm số người chết vì các bệnh truyền nhiễm. Vào thời điểm đó, các nhà khoa học không biết rằng vệ sinh không tốt đã khiến vi trùng truyền nhiễm, lây lan.

Sơ đồ hoa hồng của Nightingale được thiết kế để trông giống như hai bông hồng cạnh nhau. Một bông đại diện cho bệnh tật và tử vong trước khi áp dụng các biện pháp vệ sinh; bông hoa còn lại chỉ ra những điều đó sau khi áp dụng các biện pháp vệ sinh. Kết quả là bà đã cho thấy một hình ảnh trực quan rõ ràng về tất cả các trường hợp tử vong mà các biện pháp vệ sinh đã giúp ngăn chặn được. Sơ đồ đã thuyết phục được các bác sĩ, lúc bấy giờ còn đang do dự về tính hợp lý của các biện pháp vệ sinh của Nightingale. Cuối cùng, các biện pháp vì sức khỏe cộng đồng đã được thông qua.

Để tránh trở thành con mồi của các đồ thị và biểu đồ gây hiểu lầm, bạn nên kiểm tra phản ứng cảm xúc của mình với chúng khi xem xét các dữ liệu khác. Sau khi nhận thấy những cảm xúc đó, hãy xác minh rằng bạn hiểu biểu đồ đang thực sự nói gì –⁠ ý nghĩa của các trục, những gì đang được tính toán hoặc biểu đồ đang phản ánh những thử nghiệm gì. Sẽ có lúc, bạn nhận ra ai đó có thể đang cố gắng thuyết phục bạn về điều gì đó, điều này hoàn toàn ổn khi bạn đã hiểu được thông tin đằng sau rồi.

10. Luôn giữ một tâm trí cởi mở và sẵn sàng sửa đổi ý kiến của bạn.

Philip Tetlock là một nhà tâm lý học trẻ sinh ra ở Canada, cùng với một nhóm các nhà khoa học xã hội khác, đã được giao một nhiệm vụ to lớn, đó là: ngăn chặn chiến tranh hạt nhân giữa Mỹ và Liên Xô. Để làm được điều đó, Tetlock đã phỏng vấn vô số chuyên gia để tiếp thu tất cả các dự ngôn của họ về những gì có thể xảy ra tiếp theo và tại sao.

Tuy nhiên, Tetlock đã vô cùng thất vọng khi nhận thấy rằng các chuyên gia đều cực kỳ cứng đầu, liên tục không chịu thay đổi ý kiến khi đưa ra những bằng chứng trái ngược nhau. Nhiều người trong số họ còn không ngừng cố gắng biện minh cho những dự báo không chính xác mà họ đã đưa ra trong quá khứ. Vì vậy, Tetlock đã tạo ra một nghiên cứu khác để cho thấy mức độ dự báo tồi tệ của các nhà dự báo.

Đối với thử nghiệm của mình, Tetlock đã thu thập khoảng 27.500 dự đoán từ gần 300 chuyên gia về chính trị, địa chính trị và kinh tế. Ông ấy đã hỏi những câu hỏi rõ ràng mà sau này sẽ dễ dàng tuyên bố đúng hay sai. Và sau đó ông đã đợi 18 năm để có kết quả.

Năm 2005, Tetlock cuối cùng đã công bố kết luận của mình. Kết quả tổng thể rất đơn giản: các chuyên gia là những nhà dự báo dở ẹc. Các dự đoán họ đưa ra không chính xác, họ quá tự tin và thậm chí họ còn không nhớ các dự đoán của chính mình, họ khẳng định họ đã đúng trong khi các tập hồ sơ cho thấy họ đã sai.

Điều này có nghĩa là thế giới quá phức tạp để dự đoán? Tetlock không nghĩ là như vậy. Vì thế, ông quyết định thực hiện một nghiên cứu đầy tham vọng khác, thu hút ý kiến dự báo từ 20.000 chuyên gia cũng như những nghiệp dư.

Điều thú vị nhất rút ra từ nghiên cứu này là có một số người giỏi đưa ra dự đoán hơn những người khác – tuy rằng không hoàn hảo, nhưng cũng trên mức trung bình. Ngoài ra, chính những người đó cũng dự báo tốt hơn theo thời gian, điều đó có nghĩa là ngay lần đầu tiên, họ có thể đã không gặp may.

Tetlock gọi nhóm người này là "những nhà siêu dự báo." Một vài phẩm chất gắn kết họ lại với nhau, nhưng có lẽ điều cốt yếu nhất đó là tính cách cởi mở. Nói cách khác, những người siêu dự báo không cố chấp bám vào một phương pháp dự báo cụ thể nào cả mà họ rất vui khi thay đổi quan điểm của mình khi được đưa ra bằng chứng mới.

Nghiên cứu của Tetlock là bằng chứng cho thấy những sai lầm của chúng ta trong việc đưa ra các dự đoán thống kê không phải là kết quả của việc thiếu kiến thức mà chúng là do chúng ta từ chối chấp nhận dữ liệu. Vì vậy, hãy luôn giữ cho đầu óc tỉnh táo, rộng mở. Làm được điều đó, và kết hợp với nền tảng kiến thức thống kê vững chắc, sẽ giúp sự hiểu biết của bạn về thế giới trở nên rõ ràng và vi tế hơn rất nhiều.

"Đối với những người siêu dự đoán, niềm tin là giả thuyết cần được thử nghiệm, chứ không phải là kho báu cần được cất giữ."

Tóm tắt cuối cùng

Thông điệp chính trong bài viết này:

Để xem xét bất kỳ loại dữ liệu nào với tinh thần minh mẫn và tập trung vào các dữ kiện, hãy nhớ một số quy tắc quan trọng. Chúng bao gồm việc theo dõi phản ứng cảm xúc của bạn đối với thông tin –⁠ dù bằng hình ảnh hay bằng lời nói –⁠ và sẵn sàng cập nhật ý kiến của bạn khi nắm bắt được thông tin, bằng chứng mới. Bạn cũng nên nhìn vào bức tranh toàn cảnh của một thống kê, đảm bảo xem xét bối cảnh bao quát và xác định các sai lệch hoặc sơ suất tiềm ẩn. Mục tiêu cuối cùng thắt chặt tất cả những điều này lại với nhau là luôn luôn tò mò, tìm kiếm sự thật sâu sắc và liên tục đặt ra câu hỏi.

Lời khuyên hữu ích:

Ghi nhớ một vài “con số quan trọng”

Doanh nhân Andrew Elliott khuyến khích việc lưu giữ một danh sách ngắn các “con số mang tính bước ngoặt” trong đầu để bạn dễ dàng hiểu được tầm quan trọng tương đối của các con số khác. Dưới đây là một vài ví dụ: Dân số của Hoa Kỳ là 325 triệu người; của Vương quốc Anh là 65 triệu. Lái xe từ Boston đến Seattle là 3.000 dặm. Và một cuốn tiểu thuyết trung bình dài 100.000 từ. Khi bạn đã có những thứ đó trong đầu, bạn có thể sử dụng chúng để so sánh - ví dụ: một báo cáo 10.000 từ có vẻ dài, nhưng nó ngắn hơn mười lần so với tiểu thuyết thông thường.

Lan Anh Tran