Trong các bài viết trước, bạn đã thấy được mức độ phổ biến của Python trong ngành khoa học dữ liệu. Do có cộng đồng người sử dụng rộng rãi khắp thế giới và khả năng thực thi tác vụ thuộc nhiều ngành khác nhau, các nguồn tài liệu dành cho người học Python cũng vô cùng đa dạng và đôi lúc khiến chúng ta choáng ngợp.
Vì vây, trong bài viết này, Vinh sẽ giới thiệu 4 tựa sách được xem là phù hợp với những người muốn áp dụng Python vào công việc phân tích dữ liệu.
Hình 1: Bạn sẽ có thể tìm được rất nhiều nguồn tài liệu Python
Hình 1: Bạn sẽ có thể tìm được rất nhiều nguồn tài liệu Python
1. Python Crash Course, 2nd Edition: A Hands-On, Project-Based Introduction to Programming - Eric Matthes Đây là tựa sách cực kỳ phù hợp nếu bạn đang là một Python beginner. Cuốn sách giới thiệu đầy đủ các khái niệm cơ bản trong Python như biến, hàm, lớp, vòng lặp, điều kiện và các loại dữ liệu cùng ví dụ trực quan để minh họa. Bên cạnh đó, bạn cũng được tìm hiểu các project, nơi áp dụng các thư viện, module khác nhau để tạo ra một chương trình hoàn chỉnh. Python Crash Course được trang web realpython.com xếp hạng đầu tiên trong danh sách những cuốn sách hay nhất dành cho học Python. 📕 Link (for resources in the book): https://ehmatthes.github.io/pcc_2e/regular_index/
2. Python for Data Analysis: Data Wrangling with Pandas, Numpy, and IPython - Wes McKinney
Đúng như tên gọi, cuốn sách này cung cấp đầy đủ kiến thức cũng như rất nhiều ví dụ dễ hiểu để bạn đọc và thực hành phân tích dữ liệu với các thư viện pandas và numpy. Đặc biệt, tác giả Wes McKinney chính là người tạo ra thư viện pandas, nên cuốn sách được trình bày rất dễ hiểu ngay cả với những người chỉ mới bắt đầu làm quen với Python. Các tài liệu hay file dữ liệu được dùng trong sách có sẵn trên GitHub, bạn có thể tải xuống và thực hành bất cứ lúc nào.
Hình 2: Những cuốn sách Python rất bổ ích cho người làm trong ngành dữ liệu
Hình 2: Những cuốn sách Python rất bổ ích cho người làm trong ngành dữ liệu
3. Python Data Science Handbook - Jake VanderPlas
Thêm một tựa sách tập trung vào các module dùng cho phân tích dữ liệu. Tuy nhiên, không chỉ có các thư viện cơ bản như pandas hay numpy, cuốn sách này còn giới thiệu khá sâu về trực quan hóa dữ liệu với matplotlib và seaborn, cũng như thư viện scikit-learn và các mô hình thuật toán cơ bản trong machine learning. Các ví dụ trong sách cũng có thể dễ dàng tìm và theo dõi trên GitHub. 📕 Link: https://jakevdp.github.io/PythonDataScienceHandbook/
4. Automate the Boring Stuff with Python, 2nd Edition: Practical Programming for Total Beginners - Al Sweigart
Khác với những cuốn sách trên, Automate the Boring Stuff with Python tập trung giải quyết bài toán tối ưu hóa quy trình làm việc. Cuốn sách đi sâu vào các tác vụ đơn giản nhưng lặp đi lặp lại, dùng ngôn ngữ lập trình để tự động hóa các quy trình đó, rút ngắn thời gian đồng thời đảm bảo độ chính xác gần như tuyệt đối, giúp chúng ta tiết kiệm nhiều giờ đồng hồ làm việc để tập trung giải quyết các mục tiêu quan trọng khác. Sau một thời gian thiết lập các chương trình, chứng kiến các đầu việc nhàm chán từng lấy đi vài ngày trong quỹ thời gian, giờ đây được hoàn thành chỉ trong vài giờ, thậm chí vài phút, rõ ràng giúp hiệu suất cũng như tâm trạng làm việc của bạn tốt lên rất nhiều. 📕 Link: https://automatetheboringstuff.com/
Trên đây là những cuốn sách rất bổ ích về Python dành cho người làm trong ngành dữ liệu. Hy vọng bạn sẽ học được nhiều điều thú vị từ các tựa sách trên để áp dụng vào công việc của mình nhé!
----------------
Các kênh chia sẻ thông tin về Data Analyst của mình:
👉 Thảo luận với mình tại group chia sẻ chân thành về Data: https://bit.ly/vietnamdataanalystgroup
👉 Kênh Youtube Data Coaching: https://bit.ly/DataAnalystSharing
👉 Facebook Ngô Vinh: https://www.facebook.com/ngovinhdata
👉 Thông tin về khoá coaching:
https://bit.ly/DataAnalystCoaching1on1detail