GIẢI QUYẾT CÂU HỎI "NGƯỜI BẠN YÊU LÀ NGƯỜI THẾ NÀO" BẰNG PROGRAMMING & STATISTICAL THINKING

        Chúng ta yêu ai đó dựa trên rất nhiều yếu tố của người đó về ngoại hình, tính cách và những yếu tố phụ khác. Một người sở hữu nhiều khuôn mẫu chung (yếu tố) của cái đẹp sẽ thu hút được rất nhiều người thích và yêu. Ví dụ một khuôn mẫu chung của cái đẹp ở nam là đẹp trai, học giỏi, con nhà giàu chẳng hạn. Tôi gọi những khuôn mẫu chung này là những yếu tố ảnh hưởng đến quá trình mà bạn yêu một người hay được diễn giải bằng công thức sau:
        Yêu (thích) = Ngoại hình + Tính Cách + Các yếu tố chung khác
Các yếu tố chung khác ở đây có thể là tài sản, địa vị xã hội, sự ảnh hưởng trong lĩnh vực X nào đó, ...
        Dạo gần đây, khi nói chuyện với một người bạn, tôi bảo nó là tôi có thích một người, thế là tôi gửi ảnh qua cho nó xem. Nó bảo: "Sao những con mày gửi tao đều có mắt mèo thế ?". Ý nó mắt mèo ở đây là mắt một mí. Tôi cũng không để ý đến vấn đề này cho lắm, chắc chỉ là trùng hợp ngẫu nhiên thôi.
        Vì bận ôn tập cho kỳ thi cuối kỳ sắp tới nên tôi quên đi mất chuyện này. Trong buổi thi thực hành môn Lập trình hướng đối tượng, đang lan man suy nghĩ vẩn vơ, tôi bỗng nhớ lại câu chuyện trên, có lẽ việc tôi thả suy nghĩ của mình lơ lửng như vậy hóa ra lại là một điều hay để tìm mối tương quan giữa tình yêu, lập trình và thống kê.
Có phải những người mà bạn thích đều có một số tính cách hay ngoại hình chung nào đó ?   
        Tôi tự hỏi bản thân: "Liệu những người tôi yêu có phải sẽ có những đặc điểm chung về ngoại hình nhất định không ?". Để cụ thể hơn, tôi xin mô hình hóa lại bài toán như sau:
Có hay chăng ảnh hưởng yếu tố hình dáng của mắt lên mức độ thích một người ?

Kiểm định giả thuyết 

Ở bài toán này, để đơn giản tôi giả sử:
Hình dáng của mắt được chia thành 3 nhóm: Mắt một mí, mắt hai mí và mắt mí lót. Mức độ thích một người được tính dựa trên thang đo từ 0 đến 10.
Ví dụ hình ảnh minh họa về hình dáng của mắt
        Gọi X là biến nguyên nhân (yếu tố) ảnh hưởng đến biến kết quả Y. Biến X ở đây trong bài toán này là những đặc điểm hình dáng của mắt ảnh hưởng đến yếu tố bạn có thể thích ở một người.
        Gọi Y là biến kết quả (biến phụ thuộc) thể hiện mức độ thích của một người dựa trên hình dáng của mắt.
        Với bài toán này, việc phân tích sự phụ thuộc giữa một biến nguyên nhân (thường là biến định tính hoặc một biến định lượng được chuyển về định tính) với ít nhất 3 nhóm tính chất khác (mắt một mí, mắt hai mí và mắt mí lót) với một biến định lượng khác trong thống kê người ta gọi là phân tích phương sai một yếu tố (ANOVA).
Demystifying hypothesis testing - Blog | luminousmen
Ví dụ về giả thiết H0 và đối thiết H1 trong bài toán kiểm định thống kê
        Giả thiết đặt ra là có không hay không sự khác biệt về mức độ thích ở một người dựa trên hình dáng của 3 loại mắt ( giả định là phương sai các tổng thể về mức độ thích ở một người là bằng nhau, tuân theo phân phối chuẩn, các mẫu được chọn ngẫu nhiên và độc lập nhau).
        Tôi tạm bỏ qua các chi tiết tính toán phức tạp về việc phân tích ANOVA, để đi đến phần kết luận giả định dựa trên giá trị kiểm định F theo quy luật phân phối Fisher-Snedecor qua công thức sau:
R Tutorial : How to interpret F Statistic in Regression Models – Tutorials  for Data Science , Machine Learning, AI & Big Data
Công thức tính giá trị kiểm định F theo quy luật Fisher-Snedecor
          Nếu giá trị kiểm định F thuộc miền bác bỏ thì ta có thể kết luận bác bỏ giả thiết H0 hay mức độ thích một người phụ thuộc vào hình dáng của mắt nghĩa là hình dáng của mắt là một trong những yếu tố quan trọng để quyết định bạn thích ở một người là nhiều hay ít.
        Ngược lại, chấp nhận H0 hay mức độ thích một người không phụ thuộc vào hình dáng của mắt, nghĩa là mắt của cô ta có hình dạng gì đi chăng nữa thì vẫn không thể quyến rũ được bạn hay khiến bạn để tâm và để ý. 

TỔNG QUÁT HÓA ĐẶC BIỆT HÓA ĐỐI TƯỢNG

        Đôi lúc để yêu một người nào đó, chúng ta thường có những khuôn mẫu hay những tiêu chuẩn nhất định nhưng sẽ có lúc các tiêu chuẩn đó sẽ không còn giá trị trước lời gọi của trái tim, mà nhiều người thường gọi là khoảnh khắc rung động. Khái niệm rung động đối với tôi, là cái gì đó thật mơ hồ và mỗi người có một cách định nghĩa khác nhau. Để cụ thể hơn về khái niệm "rung động" ở mỗi người, tôi sẽ thử tổng quát hóa và đặc biệt hóa đối tượng việc này giúp ta hình dung rõ ràng hơn khái niệm rung động của chính mình.
        Tổng quát hóa đối tượng, người ta yêu phải là người hấp dẫn giới tính đối với ta, đó là điều kiện cần, là khuôn mẫu chung của tất cả mọi người.
Tổng quát = Giới tính hấp dẫn 
        Đặc biệt hóa của một dạng đối tượng tổng quát sẽ có đầy đủ tính chất của loại đối tượng ban đầu và có thêm các đặc điểm riêng của nó. Người bạn yêu sẽ là người đặc biệt với bạn, ở người đó sẽ có những tính chất đặc điểm mà bạn nhìn thấy được ở người đó mà người khác không thể phát hiện ra hay nhìn thấy.
Đặc biệt hóa = Yếu tố riêng (Yếu tố đặc trưng của đối tượng) mắt mèo 
Ví dụ: Tôi thích người có mắt mèo chẳng hạn, một số người khác lại không thích, không cùng gu với tôi. Mắt mèo là một yếu tố đặc biệt của đối tượng tôi thích mà điều này đã được kiểm định giả thiết từ vấn đề trên, hình dáng của mắt là một yếu tố quan trọng mà tôi thích ở một người.
        Rung động là một khái niệm trừu tượng, thể hiện một lời gọi của trái tim. Bạn có thể rung động với một anh chàng, chỉ vì hành động cử chỉ ấm áp của anh ta khi giúp đỡ một bà cụ qua đường hay chỉ là giọng nói ấm áp (yếu tố đặc biệt) khiến bạn hạnh phúc đến lạ kỳ. 
Rung động = Tổng quát hóa + Đặc biệt hóa  

THỐNG KÊ

        Thống kê là một nhánh của toán học liên quan đến việc thu thập, phân tích, diễn giải hay giải thích và trình các dữ liệu. Cụ thể ở đây, chúng ta sẽ thu thập những dữ liệu về người mà bạn từng thích như tuổi tác, ngoại hình, tính cách và những thông tin liên quan khác, dữ liệu càng nhiều càng cụ thể chúng ta sẽ trích xuất được những thông tin đặc trưng nhất quan trọng nhất của tổng thể.
Ví dụ: Khảo sát thông tin của 30 người bạn từng yêu, tìm những điểm tổng quát hóa và đặc biệt hóa của 30 đối tượng đó. Tiến hành kiểm định giả thuyết các yếu tố đó, chúng ta sẽ có được những thông tin hết sức bất ngờ mà trước đây chúng ta chưa biết. Tôi gọi cách này là một trong những cách để hiểu mình, hiểu người mà mình sẽ thích, sẽ yêu trong tương lai từ những dữ kiện trong quá khứ và hiện tại.
        Từ những trình bày trên, tôi đã giải quyết vấn đề theo hướng đi từ đơn giản hóa cho đến tổng quát hóa bài toán, cụ thể là kiểm định giả thiết thống kê, tổng quát hóa đặc biệt hóa đối tượng và thống kê số mẫu từ tổng thể. 

KẾT

        Chúng ta yêu một ai đó chỉ bởi vì chúng ta yêu họ. Để hiểu hơn tại sao ta yêu họ, điều này có thể lý giải khoa học bằng kiến thức thống kê và tính chất kế thừa của lập trình hướng đối tượng.
        Tôi là người không thích sự mơ hồ, một thứ có thể được cụ thể và chi tiết đến bao nhiêu thì chúng ta càng dễ nắm bắt và đưa ra những phương hướng thích hợp để giải quyết, điều này cũng giúp ta hiểu mình và hiểu người hơn, chủ động hơn trong bất kỳ vấn đề gì.
        Nội dung của bài viết sẽ có một số sai sót bởi đây là lần đầu tôi sử dụng kiến thức thống kê và lập trình để liên hệ với nhau nên nếu cảm thấy có chỗ nào không thỏa đáng bạn có thể bình luận phía dưới cho tôi biết.
P/s: Nếu cảm thấy hay hãy cho tớ một vote để có động lực ra những bài viết mới hơn nhé, sẽ còn những chủ đề thú vị mà mình muốn chia sẻ đến với mọi người. Cảm ơn mọi người đã đọc đến đây.
22
2342 lượt xem
22
4
4 bình luận