[Kinh tế học] Khi Big Data giết chết giấc mơ Mỹ - American Dream
Bài này xin giới thiệu với các bạn nghiên cứu mới nhất của một trong những nhà kinh tế học được cho là có ảnh hưởng lớn nhất hiện nay...
Bài này xin giới thiệu với các bạn nghiên cứu mới nhất của một trong những nhà kinh tế học được cho là có ảnh hưởng lớn nhất hiện nay - giáo sư Raj Chetty của Harvard, sử dụng administrative/big data (dữ liệu hành chính). Vì khả năng sắp tới mình sẽ phải làm việc với administrative data nên mấy ngày qua có tìm hiểu qua về nghiên cứu của giáo sư Chetty, chủ yếu là qua hai bài thuyết trình của ông tại LSE và EEA (link cuối bài).
TÓM TẮT NỘI DUNG NGHIÊN CỨU
Đây là một dự án nghiên cứu lớn sử dụng administrative data để tìm hiểu về bất bình đẳng - inequality và tỷ lệ di động xã hội - social mobility, hai trong số những chủ đề quan trọng nhất trong nghiên cứu kinh tế. Cụ thể hơn, nghiên cứu tập trung vào tỷ lệ trẻ sinh ra trong gia đình có thu nhập thấp (bottom fifth - 20%) có thể vươn lên top 20% thu nhập ở tuổi trưởng thành – hay còn được gọi là tỷ lệ upward mobility; xem xét sự khác biệt của tỷ lệ này theo các vùng địa lý và từ đó tìm kiếm những yếu tố ảnh hưởng hay quyết định tỷ lệ này. Những kết luận quan trọng nhất là: (1) điều kiện nơi sống của đứa trẻ quyết định thu nhập, chứ không phải các điều kiện khi nó trưởng thành; (2) việc di chuyển đến nơi có điều kiện sống tốt hơn càng sớm sẽ khiến tỷ lệ thành công của trẻ càng cao, nhưng ảnh hưởng lớn nhất lại đến từ những năm tháng tuổi teen; và (3) ảnh hưởng của một giáo viên tốt lên trẻ là cực kỳ lớn.
1. Giấc mơ Mỹ đã không còn ... ở Mỹ

Người Mỹ vẫn luôn tự hào về giấc mơ Mỹ, điểm đến thiên đường, nơi hứa hẹn cung cấp cho mọi đứa trẻ cơ hội ngang nhau; và tài năng + nỗ lực mới là thứ quyết định sự thành công của một cá nhân thay vì những điều kiện gia đình quan hệ cocc các thứ. Tuy nhiên, nghiên cứu của giáo sư Chetty và các đồng sự cho thấy điều đó đã không còn là hiện thực. Thực tế, tỷ lệ trẻ sinh ra trong gia đình thu nhập thấp vươn lên được top 20% về thu nhập trong xã hội ở Mỹ chỉ là 7.5%, kém hơn tất cả các nước mà nhóm nghiên cứu có thể thu thập số liệu. Cụ thể, tỷ lệ này chỉ bằng nửa so với Canada - 13.5%, và thậm chí còn kém hơn cả nước vẫn hay được so sánh với Mỹ là Anh - 9%.

(Xin nghiêm túc tự vả về trò giật tít)
Đọc thêm:
2. Môi trường nơi sống khi bạn còn trẻ sẽ quyết định rất lớn đến thu nhập

Trong phần chính của dự án, Big data cho phép nhóm nghiên cứu tìm hiểu về nhóm đối tượng dịch chuyển từ những vùng có tỷ lệ upward mobility thấp sang những vùng có tỷ lệ upward mobility cao, theo từng độ tuổi. Sau khi lấy kết quả trung bình, số liệu dạng đồ thị cho thấy rõ việc chuyển vùng càng sớm có ảnh hưởng càng lớn đến thu nhập khi trẻ đến độ tuổi trưởng thành (30 tuổi).

Thực ra điều này có thể mới ở Mỹ chứ chả mới mẻ gì ở các nước phương Đông. Còn nhớ trong Cổ học tinh hoa có tích "Mẹ hiền dạy con":
Thầy Mạnh Tử, thuở nhỏ, nhà ở gần nghĩa địa, thấy người ta đào, chôn, lăn khóc, về nhà cũng bắt chước đào, chôn, lăn khóc. Bà mẹ thấy thế nói: “Chỗ này không phải chỗ con ta ở được”. Rồi dọn nhà ra gần chợ.Thầy Mạnh Tử ở gần chợ, thấy người buôn bán điên đảo, về nhà cũng bắt chước nô nghịch một cách buôn bán điên đảo. Bà mẹ thấy thế lại nói: “Chỗ này cũng không phải là chỗ con ta ở được”.Bèn dọn nhà đến ở cạnh trường học. Thầy Mạnh Tử ở gần trường học, thấy trẻ đua nhau học tập lễ phép, cắp sách vở, về nhà cũng bắt chước học tập lễ phép, cắp sách vở. Bấy giờ bà mẹ mới vui lòng nói: “Chỗ này là chỗ con ta ở được đây”.
Tuy nhiên, có hai điều thú vị ở đây.
Một là đường đồ thị lại dốc hơn ở lứa tuổi teen, chứng tỏ ảnh hưởng của thay đổi môi trường có thể còn mạnh hơn ở độ tuổi này, thay vì ở tuổi nhỏ. Điều này đi ngược lại với chính sách của các nước trên thế giới trong thời gian gần đây, thường tập trung nhiều hơn vào những năm tháng đầu tiên trong cuộc đời một đứa trẻ.
Hai là hoàn cảnh môi trường này còn có sức ảnh hưởng hơn cả điều kiện gia đình của chính đứa trẻ. Khi nhóm nghiên cứu tìm hiểu về những đứa trẻ được sinh ra trong gia đình có cả cha mẹ nhưng ở vùng mà tỷ lệ cha/mẹ độc thân (single parent) cao thì tỷ lệ upward mobility vẫn rất thấp.
3. Ảnh hưởng của một giáo viên tốt là cực kỳ quan trọng đến sự thành công của trẻ

Đọc thêm:
Để tìm hiểu về ảnh hưởng của giáo viên, một chỉ số được dùng đến trong nghiên cứu là chỉ số tạo giá trị của giáo viên. Chỉ số này được đo bằng hiệu số của điểm trung bình của lớp đầu năm và cuối năm, vì nếu hiệu số này lớn chứng tỏ giáo viên phần nào đã có những tác động tích cực đến khả năng hiểu bài và có thể cả sự chăm chỉ của trẻ.
Big data cho phép nhóm nghiên cứu đánh giá ảnh hưởng của những giáo viên có chỉ số tạo giá trị cao khi họ chuyển từ trường A sang trường B lên điểm số của học sinh ở trường B, và sau đó là tỷ lệ upward mobility của nhóm học sinh được học với giáo viên mới ấy.
Ví dụ trong hình dưới là điểm số của học sinh lớp 4 (đường liền nét) trước và sau khi trường nhận một giáo viên dạy lớp 4 (giáo viên này trong top 5% theo chỉ số tạo giá trị). Dễ dàng thấy là điểm số của học sinh lớp 4 ở 3 khóa liên tiếp sau khi giáo viên này chuyển đến trường B tăng lên rõ rệt.
Cái hay của big data là nó cho người nghiên cứu những cách để kiểm chứng độ tin cậy của kết quả một cách khá dễ dàng, khác biệt rất nhiều so với số liệu dựa trên 1 bảng điều tra hay những loại số liệu khác từng được sử dụng. Ví dụ như ở đây, để kiểm chứng liệu kết quả này có phải do giáo viên ấy chuyển đến, hay do trường B nâng chất lượng dạy học, nhóm nghiên cứu có thể đối chiếu sự thay đổi của điểm số trung bình của các em học sinh lớp 3, tức là nhóm mà vị giáo viên mới đến gần như không có ảnh hưởng. Và kết quả, đường đứt nét - điểm số trung bình của học sinh lớp 3 cùng trường không ghi nhận bất cứ sự thay đổi rõ rệt nào.
Cái hay của big data là nó cho người nghiên cứu những cách để kiểm chứng độ tin cậy của kết quả một cách khá dễ dàng, khác biệt rất nhiều so với số liệu dựa trên 1 bảng điều tra hay những loại số liệu khác từng được sử dụng. Ví dụ như ở đây, để kiểm chứng liệu kết quả này có phải do giáo viên ấy chuyển đến, hay do trường B nâng chất lượng dạy học, nhóm nghiên cứu có thể đối chiếu sự thay đổi của điểm số trung bình của các em học sinh lớp 3, tức là nhóm mà vị giáo viên mới đến gần như không có ảnh hưởng. Và kết quả, đường đứt nét - điểm số trung bình của học sinh lớp 3 cùng trường không ghi nhận bất cứ sự thay đổi rõ rệt nào.
Và thực ra, đồ thị thực tế là kết quả trung bình của hàng trăm trường hợp giáo viên thay đổi trường, chứ không phải của một cá nhân cụ thể.

Khi lặp lại đồ thị với tỷ lệ upward mobility của nhóm học sinh này thì kết quả cũng gần tương tự, chứng tỏ ảnh hưởng của giáo viên tốt lên học sinh là cực kỳ quan trọng.
Tất nhiên có những câu hỏi nghi vấn có thể đặt ra cho kết quả này, khi chỉ một giáo viên ở một lớp nhất định mà có thể có ảnh hưởng lớn đến vậy. Về điểm này, mình nghĩ có hai yếu tố khiến kết quả này có thêm độ tin cậy. Một là giáo viên tốt thường ảnh hưởng rất lớn đến khả năng tiếp thu kiến thức của trẻ; và một khi trẻ đã biết cách tiếp thu kiến thức, cách học, và có một sự tự tin nhất định thì khả năng cao sẽ tiếp tục thu được những thành quả trong các lớp trên và vì vậy có nhiều cơ hội vào những trường đại học tốt, như một phản ứng cộng hưởng dây chuyền. Hai là những giáo viên tốt thì thường cũng ít khi chuyển sang những trường có chất lượng quá tệ. Vậy nên nếu giáo viên các lớp trên dù không thể tốt bằng thì cũng không đến nỗi kéo các em học sinh này đi xuống một cách thảm hại.
Kết: Tóm lại, nghiên cứu cho thấy việc nâng cao điều kiện môi trường sống có thể ảnh hưởng rất lớn đến khả năng thành công của trẻ nhỏ, và những dấu hiệu tích cực trong việc thay đổi môi trường sẽ vẫn xuất hiện đến độ tuổi 20. Đây là một tín hiệu đáng mừng, vì có rất nhiều cách ta có thể thực hiện để nâng cao điều kiện môi trường. Như đơn cử việc sử dụng thêm vốn để nâng cao chất lượng đội ngũ giáo viên, nếu được thực hiện nghiêm túc và có hiệu quả, chắc chắn sẽ ảnh hưởng rất lớn đến khả năng của trẻ.
Bên cạnh đó, một điểm mình thực sự kỳ vọng nghiên cứu này sẽ có ảnh hưởng đến đối tượng cha mẹ học sinh. Vì nếu như cho con vào trường tốt là tất cả những gì trong tầm kiểm soát mà cha mẹ có thể cố gắng thực hiện, thì là chính một giáo viên tốt cho con cái lại hoàn toàn nằm trong tầm tay của mỗi người phụ huynh.
Và cuối cùng, Big data bắt đầu cho thấy sự vượt trội của nó trong việc cho phép nhà nghiên cứu phân tích câu hỏi với số lượng quan sát lớn hơn, và có nhiều cách hơn để kiểm chứng độ tin cậy của kết quả. Vậy nên chắc chắn trong thời gian tới nó sẽ mở ra rất nhiều hướng nghiên cứu có độ tin cậy và tính ứng dụng thực tiễn cao. Các bạn sinh viên kinh tế đừng bỏ qua một hướng đi có thể nói sẽ rất hot trong thời gian 5 10 năm tới này nhé. Cố đừng cúp tiết Kinh tế lượng với Thống kê kinh tế là điều đầu tiên có thể làm :)

A Dreamer
Nguồn ảnh: anh Google + ảnh chụp từ 2 bài thuyết trình dưới đây của giáo sư Chetty:

Góc nhìn thời sự
/goc-nhin-thoi-su
Bài viết nổi bật khác
- Hot nhất
- Mới nhất

duongAQ

Mình cũng đang lăn lộn trong công cuộc học về phân tích dữ liệu + vẽ biểu đồ sao cho được đẹp như trong bài.
Ngoài 2 môn học chính quy trong trường mà tác giả nêu trên, mình xin gợi ý thêm 1 số "món ăn tinh thần" để mọi người tham khảo:
- Excel (sure), trong đó học kỹ về Pivot Table và tạo Slicer, Pivot Chart
- Power Query: cái này giúp tái cấu trúc các bảng dữ liệu, giúp bạn có nguồn nguyên liệu tốt phục vụ cho việc xây dựng các mô hình phân tích.
- Dashboard: học về dashboard giúp bạn có tư duy tổng quan về dữ liệu, cách trực quan hóa dữ liệu và tập phân tích dữ liệu)
- Power BI: cuối cùng là gom tất cả những thứ ở trên đưa vào 1 công cụ duy nhất là power BI để ra sản phẩm cuối cùng.
- Báo cáo

củ cải đi hoang
Bài viết này em thấy khá hay https://www.google.com/amp/s/amp.theatlantic.com/amp/article/511925/ Nó phản biện lại việc social mobility thật sự phản ánh mức độ cởi mở của xã hội, bởi vì để trèo lên top 20% thu nhập ở nước Mĩ thì khó hơn ở Anh hay Đan Mạch rất nhiều. Tác giả bài viết cho rằng social mobility là một chỉ số bị overrated, thay vào đó tập trung vào life quality, mức độ sống thay đổi từ đời cha sang đời con (gấp đôi, gấp ba) thì hợp lí hơn. Anh có thể tham khảo ạ
- Báo cáo

củ cải đi hoang
Anw cảm ơn bài viết của anh nhiều ^^.
- Báo cáo

Surphi10

Anh có thể phân tích kỹ hơn đồ thị 2 về độ tuổi không, em đang thắc mắc tại sao lại lấy income ở tuổi 35 ra so sánh mà không phải chênh lệch income ở tuổi 35 so với cha mẹ? Với lại anh có giả thuyết nào về việc việc thay đổi môi trưởng ở tuổi teen có tác động nhiều hơn ở tuổi nhỏ không? Cảm ơn anh ^^
- Báo cáo

Andy Luong

Câu hỏi hay lắm

Em mở cái video thứ 2 ở EEA ra nhé, phút 7.55 có hình đồ thị về chênh lệch income của con cái và cha mẹ đấy. Đấy theo anh hiểu cũng chính là lý do đầu tiên để nhóm nghiên cứu bắt đầu dự án - vì tỷ lệ này đã xuống rất thấp, ở một khía cạnh nào đó nó phản ánh vấn đề của tỷ lệ di động xã hội.
Ý thứ 2, anh nghĩ do vấn đề nhận thức với tâm lý là chính. Vì nếu quá nhỏ có lẽ trẻ lại không hiểu/thấm cái ý nghĩa của việc thay đổi. Trong khi ở tuổi teen, ít nhất các bạn đã có trải nghiệm về những thứ không tốt, nhưng lại ở mức vẫn có thể thay đổi được nếu được tiếp cận những thứ tốt hơn, đặc biệt là về môi trường và bạn bè. Vậy nên mỗi thay đổi ở tuổi teen có thể lại có tác động mạnh hơn.
P.s. À mà, về tuổi 35, có lẽ là kết quả đẹp nhất nên họ để trong đồ thị như thế thôi. Chứ trong bài thuyết trình ông ấy có nói là để chắc chắn độ tin cậy của kết quả họ không chỉ tính một năm đâu, mà là các năm trong độ tuổi 30 đấy.
- Báo cáo

Leonardo
bài hay ạ
- Báo cáo