Điều gì khiến tôi lựa chọn học Machine Learning?
Trót yêu giải đố, mình đã có cuộc tình 10 năm với Machine Learning.
Nếu tình cờ bài viết này xuất hiện trên Facebook, Instagram hay YouTube của bạn, thì đó là kết quả từ sự chọn lọc của trí tuệ nhân tạo (artificial intelligence - AI) đằng sau mỗi nền tảng. Một phương pháp rất phổ biến của trí tuệ nhân tạo hiện nay là quá trình học máy (machine learning). Nói một cách đơn giản thì học máy là hoạt động sử dụng thuật toán để xây dựng các mô hình dựa trên dữ liệu mẫu, để từ đó các mô hình này có thể phân tích, dự đoán hoặc đưa ra các quyết định mà không cần sự can thiệp của con người.
Ở mức độ cơ bản nhất, machine learning là dạy máy tính cách phân biệt giữa hình vuông và hình tròn, giữa cái xe đạp và cái ô tô, giữa con người và động vật. Phức tạp hơn, nó có thể là thống kê, sàng lọc, phỏng đoán và lựa chọn nội dung phù hợp nhất với từng cá nhân hoặc từng nhóm người, dựa trên lịch sử tiêu thụ nội dung của họ. Hoặc, nó cũng có thể là một trợ lý ảo với khả năng đối thoại vượt xa hình dung của chúng ta về một “trí tuệ nhân tạo”.
Dù muốn hay không thì AI nói chung và machine learning nói riêng đã và đang định hình thế giới của chúng ta. Đồng thời, nó cũng là thứ đã mở ra hành trình học hỏi, nghiên cứu đầy thăng trầm kéo dài gần 10 năm của mình.
Machine Learning đã bước vào cuộc sống của tôi như thế nào?
Khi vừa bước vào ngưỡng cửa đại học, mình cũng như rất nhiều bạn sinh viên cùng lứa khác không biết chọn ngành gì cho 4 năm sắp tới. Mình đã chọn ngành Kinh tế học vì niềm ưa thích những môn khoa học tự nhiên như Toán, cũng như việc mình được đi học ở gần các trung tâm kinh tế lớn. Trong kỳ học đầu tiên, mình đã học được rất nhiều kiến thức mới mẻ về kinh tế vĩ mô như chính sách tiền tệ, chính sách tài khóa, v.v… Song, những hiểu biết mới này vẫn không đủ để lấp đầy tính hiếu kỳ của mình. Mình thèm khát một chủ đề thú vị và thực tiễn hơn. Và có vẻ như vũ trụ đã nghe được tín hiệu của mình.
Trong một buổi tụ tập bàn chuyện phiếm tại ký túc xá, mình gặp Jeff, người đã quyết định đi học lại đại học sau 4 năm đi làm lập trình viên. Chuyện nọ xọ chuyện kia, Jeff rủ mình thử làm bài tập trong một lớp lập trình anh ý đang theo học. Với một đứa không biết gì như mình, Jeff đã miêu tả những bài tập của anh ý theo dạng những “câu đố” hết sức đơn giản mà trực quan, chả hạn như xây dựng một chiếc website nhỏ với chức năng thay đổi màu màn hình dựa vào số lần mình click chuột. Những câu đố thế này giúp mình nhìn ra được những ứng dụng thực tế của lập trình, cũng như “đánh vào” niềm yêu thích giải đố của mình. Cứ như thế, mình giải hết câu đố này qua câu đố kia mà bỏ quên thế giới, như thể tính hiếu kỳ của mình đang hoàn toàn được lấp đầy. Sau một thời gian nghiên cứu và suy nghĩ, mình đã đưa ra quyết định mang tính bước ngoặt, đó là biến ngành học này thành ngành học chính, và học 2 văn bằng: Kinh tế học… và Khoa học máy tính.

Nguồn: https://www.boredpanda.com/funny-relatable-computer-comics-system32/?media_id=1652233. Nhờ có Jeff mình đã theo con đường thay trời diệt bọ, theo đuổi đam mê về máy tính
Thế giới của Machine Learning thú vị đến đâu?
Bất ngờ thay, một trong những lớp học dường như nhạt nhẽo và khô khan nhất lại “hớp hồn” mình. Đó là lớp Lịch sử hệ thống thông minh. Từ những ngày đầu tiên, khi máy tính mới chỉ là những bản phác thảo trên giấy hay là một công cụ thô sơ để giải những bài toán phức tạp (và để phá khoá mật mã của Đức), thì một ước mơ to lớn đã được nhen nhóm bởi các nhà khoa học. Họ mường tượng về một hệ thống ưu việt với trí tuệ sánh ngang, hiểu được chúng ta và thậm chí là có khả năng tự học. Đúng vậy, tự học về một thế giới đang liên tục thay đổi từng giây từng phút, để từ đó có thể giúp đỡ con người. Giới hạn về công nghệ đã không kìm toả sức sáng tạo của con người. Và rồi, vào thập niên 50, khái niệm về machine learning ra đời, từ những câu hỏi vô cùng đơn giản như: làm thế nào để giúp cho máy móc có khả năng nhận diện đồ vật, nghe hiểu lời nói, hay tự đánh giá môi trường để thay đổi cách thức hợp tác với nhau như con người? Trong đó, nhà khoa học máy tính Arthur Samuel là người đầu tiên sử dụng cụm từ “machine learning” để mô tả phần mềm tự học chơi cờ đam do ông tạo ra.
Và các bạn biết gì không? Tuy có vẻ “máy móc” và “nhân tạo” nhưng của machine learning lại có nhiều điểm giao thoa với thiên nhiên. Ví dụ, cách thiên nhiên sản sinh ra những cá thể, những thế hệ phù hợp nhất với môi trường đã tạo nên một hướng nghiên cứu về giải thuật tiến hoá, với mục đích tìm ra những đáp án tốt hơn theo hướng “chọn lọc tự nhiên”. Hay, một khía cạnh khác là mạng neuron nhân tạo cũng được xây dựng dựa trên cấu trúc và cách hoạt động của não bộ.
Với mình, cách thử và sai của việc học dường như làm mình cảm thấy tò mò nhất. Đây là hướng tiếp cận đã góp phần cấu thành nên các giải thuật học máy khác nhau. Thời điểm mình học lớp này cũng là thời điểm học máy và học sâu (deep learning) bùng nổ với máy học. Đây chính là giai đoạn mà mạng nơ-ron nhân tạo đã đánh bại con người trong việc việc nhận diện mặt số và hình ảnh; còn Deepmind thì vừa công bố AlphaGo - trí tuệ nhân tạo đã đánh bại Lee Sedol, kiện tướng cờ vây số 1 thế giới. Chiến thắng này vô cùng quan trọng, vì sự ngẫu nhiên và phức tạp bậc nhất của cờ vây đòi hỏi người thắng cuộc phải có cả trực giác lẫn tính sáng tạo - 2 thứ từng được cho là vượt ngoài phạm trù của máy móc. Và nhắc đến sáng tạo, thì không lâu sau chiến thắng này, Australian Institute of Machine Learning, trực thuộc trường Đại học Adelaide, được thành lập. Đây là viện nghiên cứu học máy đầu tiên của Úc, hiện đang dẫn đầu thế giới ở một vài lĩnh vực bao gồm theo dõi chuyển động, nhận diện khuôn mặt, và tái tạo hình ảnh từ 2D thành 3D. Họ đã và đang hợp tác với Rising Sun Pictures để áp dụng machine learning vào sản xuất công nghệ kỹ xảo hiện đại nhất thế giới. Đã có rất nhiều bom tấn Hollywood được nhào nặn ra nhờ Australian Institute of Machine Learning và Rising Sun Pictures. Vì vậy, nếu các bạn muốn vừa theo đuổi Machine Learning, vừa muốn ở gần gia đình thì hãy cân nhắc đại học Adelaide nhé! Giờ thì quay lại với chủ đề chính.
Mình dần chìm sâu vào thế giới học máy, đến mức có thêm 1 quyết định bước ngoặt nữa. Với sức ảnh hưởng vượt xa quyết định đầu tiên. Các bạn sẵn sàng chưa? Đó là… bỏ hẳn bằng Kinh tế để tập trung hoàn toàn vào ngành Khoa học máy tính.
Vấn đề của Machine Learning: Tính riêng tư - điều khiến mình tò mò nhất

Nguồn: https://imgs.xkcd.com/comics/predictive_models.png. Nếu những dữ liệu nhạy cảm "bị" nhớ, học máy có thể gây ra những hiểm họa như thế nào?
Do muốn hiểu sâu hơn về machine learning, mình học lên cao học, và dấn thân sâu thêm vào thế giới học máy hiện đại, qua các lớp như xử lý ngôn ngữ tự nhiên (natural language processing), thị giác máy tính (computer vision), học sâu, v.v… Một điểm chung của việc dùng học máy để giải những bài toán này là mỗi mô hình cần rất rất nhiều dữ liệu để có thể hoạt động hiệu quả. Và tới đây, sự tò mò của mình lại dẫn mình sang một câu hỏi lớn khác: Nếu những mô hình máy học bao gồm dữ liệu nhạy cảm về về tài chính, sức khỏe hay thông tin cá nhân mà bị tấn công, thì hậu quả sẽ là gì, và chính ta phòng ngừa những cuộc tấn công này như thế nào?
Một ví dụ cụ thể cho lo ngại này là vụ bê bối Cambridge Analytica. Trong đó, thông tin từ gần 90 triệu tài khoản facebook đã bị lấy trộm bởi một ứng dụng thứ 3 cải trang dưới dạng một bài trắc nghiệm. Kho thông tin này sau đó được sử dụng để hình thành hồ sơ tâm lý của hàng chục triệu người Mỹ, từ đó tạo ảnh hưởng mang tính chính trị lên quá trình và kết quả của cuộc bầu cử Tổng thống.
Tính hiếu kỳ đã tiếp tục dẫn mình tới những vấn đề liên quan đến tính riêng tư của học máy (privacy of machine learning). Nhìn chung, nghiên cứu về tính riêng tư của học máy là một lĩnh vực kết hợp giữa nghiên cứu về học máy và các nghiên cứu về bảo mật, sự riêng tư. Yếu tố “riêng tư” ở đây bao gồm các vấn đề như rò rỉ thông tin cá nhân, hay cách thông tin cá nhân được sử dụng để định hướng con người, chẳng hạn như trong ví dụ Cambridge Analytica. Ngoài ra, việc nghiên cứu và phát triển tính riêng tư trong máy học còn giúp giảm thiểu các thiên kiến có thể dẫn đến phân biệt đối xử của mô hình. Rất may mắn, câu hỏi của mình đã được các nhà nghiên cứu khác quan tâm. Chung lưng đấu cật, nhóm nghiên cứu đã tìm hiểu thêm về những hiểm họa ngầm khi kẻ xấu có thể lợi dụng việc các bộ dữ liệu lớn khó bị kiểm tra nhằm đánh cắp thông tin trong tập dữ liệu dùng để dạy máy học. Mình xin phép không chia sẻ cụ thể nghiên cứu của mình vì nó sẽ vượt quá khuôn khổ nội dung bài viết và sẽ hẹn gặp lại các bạn trong một bài viết sau về chủ đề này nếu có dịp. Bằng việc nghiên cứu những cách tấn công model, mình và nhóm mong những người sử dụng các mô hình học máy sẽ có ý thức tốt hơn về bảo vệ dữ liệu cá nhân, và tìm ra những phương pháp mới để bảo vệ hệ thống.
Thay cho lời kết
Đây là nghiên cứu khởi đầu của mình, đánh dấu cho một chặng đường mới trong việc học về machine learning. Ngoài việc giúp mình hiểu sâu hơn và thực hiện niềm yêu thích học máy, việc nghiên cứu còn giúp mình mở rộng tri thức cho nhân loại, góp phần xây dựng tương lai mà học máy nói riêng và công nghệ nói chung được sử dụng an toàn. Nghe hơi vĩ mô một chút, nhưng ai cũng nên có một lý tưởng, phải không?
Sau hành trình kéo dài gần 10 năm, mình nhận ra một trong những lý do thúc đẩy mình theo đuổi đam mê học máy chính là không chỉ là niềm yêu thích giải đố, mà còn là những hệ quả mà công nghệ có thể mang lại. Từ những ngày đầu tiên, khi tiếp xúc với lập trình, mình đã luôn tự hỏi website này có thể mang lại gì cho người dùng. Luồng suy nghĩ đó đã thôi thúc mình đặt ra những câu hỏi tiếp theo và cố gắng tìm ra câu trả lời để giờ đây, mình tiếp tục muốn đưa học máy vào nhiều mặt hơn của cuộc sống bằng việc xây dựng những hệ thống có thể sử dụng những dữ liệu gần gũi nhất với người dùng, một cách an toàn.
Vì vậy, nếu bài viết này khơi gợi trong bạn sự tò mò hoặc tình yêu dành cho Machine Learning, thì hãy thử bắt đầu với việc tìm những trường đại học, viện nghiên cứu tốt nhất trong khu vực. Hiện giờ, Machine Learning đang là một lĩnh vực được đầu tư tương đối nhiều, mà lại khá đói nhân tài, nên cánh cửa cơ hội sẽ rất rộng mở đó. Biết đâu, trong quá trình học tập và làm việc, chính bạn sẽ là người tạo ra những Facebook, Google hay TikTok tiếp theo thì sao?

Khoa học - Công nghệ
/khoa-hoc-cong-nghe
Bài viết nổi bật khác
- Hot nhất
- Mới nhất

happy_666_words

bài hay và súc tích, chúc bạn viết đều đều vì mình cũng thích tìm hiểu lắm
- Báo cáo

Lê Bá Hoàng
Cảm ơn bạn đã ủng hộ!
- Báo cáo

Linh Vetter
Quality content!
- Báo cáo
Kaitou
Bài hay đó bạn, tình cờ là mình cũng đang học về Machine learning trên Udacity.
- Báo cáo
kudokhang
Cảm ơn anh vì bài viết, là một lập trình viên AI em cũng đang tìm hiểu về kỹ thuật tấn công model, không biết anh có thể chia sẻ thêm về nghiên cứu tấn công model của anh không ạ? (Với lại có phải anh là kỹ sư ML của google đang làm việc tại Úc không nhỉ?)
- Báo cáo