Machine learning là gì? - Định nghĩa dễ hiểu cho những người ngoài ngành
Ngày nay, chúng ta quá đỗi quen thuộc với cụm từ “Machine learning” (được dịch ra là “học máy” hay “máy học”). Một phần cho lý do phổ...
Ngày nay, chúng ta quá đỗi quen thuộc với cụm từ “Machine learning” (được dịch ra là “học máy” hay “máy học”). Một phần cho lý do phổ biến của Machine learning (ML) có lẽ bởi công nghệ máy học đã mang lại cho chúng ta những chiếc ô tô tự lái, khả năng nhận dạng giọng nói thực tế, tìm kiếm trên web hiệu quả và sự hiểu biết được cải thiện đáng kể về bộ gen của con người, vv. Máy học ngày nay phổ biến đến mức bạn có thể sử dụng nó hàng chục lần mỗi ngày mà không biết, minh chứng là recommendation engine (tạm dịch là công cụ đề xuất) được sử dụng điển hình bởi các ông lớn mạng xã hội như Meta, Tweeter, Netflix, Tiktok,...(thậm chí không ngoa khi nói rằng recommendation engine là vũ khí chính hái ra tiền và được đầu tư mạnh mẽ bởi các ông lớn nói trên - cụ thể mình sẽ phân tích trong một bài viết khác).
Vậy hiểu một cách cơ bản Machine learning là gì?
Thuật ngữ máy học được ra đời vào năm 1959 bởi Arthur Samuel, một IBMer người Mỹ, và là người tiên phong trong lĩnh vực máy tính chơi game và trí tuệ nhân tạo. Theo như mô tả của Arthur Samuel "Machine learning được xem như một lĩnh vực nghiên cứu mang lại cho máy tính khả năng học hỏi mà không cần phải được lập trình rõ ràng." Hay nói cách khác, Machine learning là một tập hợp con của trí tuệ nhân tạo (AI) và là lĩnh vực khoa học tính toán tập trung vào phân tích và diễn giải các mẫu (patterns) và cấu trúc (structures) trong dữ liệu để cho phép học tập, suy luận và ra quyết định bên ngoài sự tương tác của con người.
Tuy nhiên, theo ý kiến cá nhân, mình thấy định nghĩa phía trên khá chung chung và không thể giúp những bạn đọc chưa có kiến thức về AI hay ML hiểu một cách sâu sắc machine learning là gì. Vậy nên để giúp mọi người dễ hiểu hơn về định nghĩa về máy học, mình sẽ sử dụng định nghĩa của bác Tom Mitchell. Định nghĩa về ML của bác khi đọc lần đầu sẽ thấy khá là “lú” y như những định nghĩa trong sách triết. Nhưng nếu các bạn dành 2 phút để nghiền ngẫm thì sẽ thấy nó khá là dễ hiểu và theo mình nó sẽ giúp bạn thật sự hiểu machine learning là gì. Bác Tom Mitchell cho rằng "Một chương trình máy tính được cho là học hỏi từ trải nghiệm E đối với một số loại nhiệm vụ T và là thước đo hiệu suất P, nếu hiệu suất của nó ở các nhiệm vụ trong T, được đo bằng P, cải thiện theo trải nghiệm E. "
Nguyên văn trích dẫn tiếng anh sẽ là “"A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E."
Sau khi đọc xong định nghĩa trên của bác Tom, mình hiểu các bạn sẽ nghĩ gì. Lú thật sự luôn ấy chứ không phải dạng vừa. Ngày đó khi đọc được định nghĩa này về ML của bác Tom, với tâm hồn của một đứa con chuyên khối D mình cũng đã định lướt ngay và luôn vì không hiểu gì. Nhưng mà may mắn thầy Andrew Ng đã khai sáng và “giữ chân mình” lại ngẫm kỹ về định nghĩa này khiến mình ngộ ra chân lý cuộc đời “muốn hiểu những gì không ai hiểu được, thì phải đọc những gì không ai đọc được”. Hi, không lan man dài dòng nữa, mình sẽ giúp các bạn “mổ xẻ” và lấy ví dụ cho các bạn hiểu hơn về định nghĩa phía trên.
Đầu tiên, theo định nghĩa chúng mình có các bạn mang tên E, T, và P. Như những gì bác Tom nói thì E là đại diện cho trải nghiệm, T là những nhiệm vụ, sự kiện cần có để tạo ra trải nghiệm. Cuối cùng, P là kết quả đánh giá. Mức độ thể hiện (P) của ML sẽ phụ thuộc vào nhiệm vụ và sự kiện xảy ra (T) và được cải thiện dần dần qua số lần trải nghiệm (E).
Nói đơn giản thì chúng ta sẽ lấy một ví dụ như sau một anh chàng bad boy có thể tán em nào đổ em nấy là do kết quả của việc anh ta đã tiếp xúc với nhiều em gái khác nhau cũng như yêu rất nhiều người để có thể nắm bắt tâm lý của các bạn nữ. Trong trường hợp trên, kết quả P: anh chàng badboy tán em nào đổ em nấy có được là kết quả của việc tiếp xúc, nói chuyện, cư xử nhiều với các bạn nữ (T) giúp bạn bad boy hiểu hơn các bạn nữ thích cách nói chuyện, cư xử như thế nào (E).
Một ví dụ gần gũi hơn với ML thì ta có thể lấy việc dạy một model học chơi cờ caro làm ví dụ. Ở đây: E sẽ được hiểu là kinh nghiệm chơi nhiều ván cờ caro, T là những lần máy được chơi cờ caro, P là xác suất chương trình sẽ thắng trong lần chơi tiếp theo. Nếu máy được chơi cờ caro nhiều lần, với những phương pháp và kỹ thuật chơi khác nhau (đặc biệt với độ khó tăng dần) thì sẽ tạo cho máy có những trải nghiệm chơi cờ đa dạng với những cách chơi và phương pháp chơi đa dạng để học, rút kinh nghiệm và tăng khả năng chiến thắng cho những lần chơi sau.
Nói tóm lại nó cũng không có khác việc cách chúng ta học toán là mấy. Bằng việc nghe thầy cô giảng về lý thuyết, làm những dạng bài từ khó đến dễ, chúng ta tự rút ra cho mình những cách tìm lời giải hiệu quả cho các dạng bài toán với mục đích cuối cùng là đạt điểm cao trong bài kiểm tra hoặc xa hơn là đỗ vào trường chuyên lớp chọn. Thì ML cũng đi theo cách tương tự là học từ những dữ liệu được cung cấp với độ đa dạng và độ khó khác nhau trong nhiều lần để có thể dự đoán hoặc hành động đúng với kết quả mà ta kỳ vọng.
Tại bài viết này mình chỉ làm rõ định nghĩa về ML cho các bạn hiểu được ML là gì. Trong những bài viết tiếp theo mình sẽ giới thiệu thêm:
- Các loại máy học (types of machine learning)
- Machine learning hoạt động dựa trên nền tảng nào?
- Những định nghĩa cần biết liên quan đến ML
- Những dạng metrics trong ML và vai trò của chúng.
- Và nhiều phần nữa
Disclaim: Mình không học chuyên về trí tuệ nhân tạo (AI), máy học (ML) hay có bất kỳ chứng chỉ gì liên quan đến AI, ML và khoa học máy tính (CS). Những kiến thức mình chia sẻ là những gì mình tự tìm hiểu từ những nguồn tài liệu khác nhau (trong đó có khóa học Machine learning trên coursera của thầy Andrew Ng) và được chắt lọc, viết lại dưới góc nhìn của một người non-technical với mục đích giúp những bạn trái ngành có thể hiểu về ML như mình. Bởi vì mình tự tìm hiểu nên sẽ có những sai sót trong bài viết, hy vọng sẽ được các bạn có kinh nghiệm về ngành này chỉ ra để mình được chỉnh sửa và học hỏi thêm. Cám ơn mọi người rất nhiều.
Tài liệu tham khảo:
Burns, E. (2021, March 30). machine learning. SearchEnterpriseAI. https://www.techtarget.com/searchenterpriseai/definition/machine-learning-ML
NetApp. (2019). What Is Machine Learning? https://www.netapp.com/artificial-intelligence/what-is-machine-learning/
Team, E. (2020, May 06). What Is the Definition of Machine Learning? Expert.Ai. https://www.expert.ai/blog/machine-learning-definition/
Wikipedia. (2022, February 19). Machine learning. Wikipedia. https://en.wikipedia.org/wiki/Machine_learning
Vu, T. (2016b, December 26). Bài 1: Giới thiệu về Machine Learning. Tiep Vu’s Blog. https://machinelearningcoban.com/2016/12/26/introduce/
Andrew Ng. (n.d.). What is Machine Learning? Coursera. https://www.coursera.org/learn/machine-learning/supplement/aAgxl/what-is-machine-learning
Khoa học - Công nghệ
/khoa-hoc-cong-nghe
Bài viết nổi bật khác
- Hot nhất
- Mới nhất