Data Analyst/Data Scientist là những vị trí nghề nghiệp đang ngày càng trở nên phổ biến và cần thiết trong các doanh nghiệp hiện đại. Người làm dữ liệu được kỳ vọng sẽ là người mang tư duy học hỏi không ngừng, cải tiến liên tục để biến những con số và thông tin đã được thu thập thành những insights hữu ích giúp tình hình kinh doanh của doanh nghiệp ngày càng đi lên.
Để thực hiện điều đó, việc củng cố các kỹ năng sẵn có và trang bị thêm kiến thức, kỹ năng mới là điều tất yếu.

1. Kiến thức chuyên ngành

Dưới đây là top 5 kiến thức chuyên ngành Domain/Industry Knowledge mà người làm việc trong ngành Khoa học dữ liệu cần trang bị. Bạn có thể rất giỏi về số học, thành thạo các công cụ phân tích, nhưng nếu không đủ kiến thức chuyên ngành (domain knowledge), bạn không thể biến những con số thu được thành insights hoặc đưa ra tư vấn hỗ trợ stakeholder trong quá trình ra quyết định. Đó là một sự lãng phí rất lớn và trong dài hạn sẽ khiến bạn dần mất đi lợi thế.
Hình 1: Domain/ Industry Knowledge
Hình 1: Domain/ Industry Knowledge
Competitive Landscape: bối cảnh cạnh tranh hiện tại của doanh nghiệp. Bao gồm hiểu biết về đối thủ cạnh tranh trực tiếp và gián tiếp; có thể với mỗi nhóm sản phẩm/dịch vụ của doanh nghiệp lại có những nhóm đối thủ khác nhau. Hiểu rõ vị thế của doanh nghiệp có thể giúp người làm dữ liệu có thể dễ dàng nắm bắt insight từ số liệu của nội bộ và của thị trường.
Industry Trends: xu hướng phát triển trong dài hạn và ngắn hạn của ngành/lĩnh vực sản xuất, kinh doanh hiện tại. Bao gồm các yếu tố vĩ mô và vi mô có thể tác động để dễ dàng dự đoán xu hướng, hỗ trợ quá trình ra quyết định.
Industry Acronyms: các thuật ngữ chuyên ngành, có thể là nhóm sản phẩm/dịch vụ hoặc các công nghệ đang được ứng dụng và phát triển.
Business/Revenue Model: mô hình doanh thu được hiểu là cách thức để doanh nghiệp có doanh thu, tạo ra lợi nhuận, và mức lợi nhuận lớn hơn trên vốn đầu tư. Đây được coi là chiến lược quản lý các luồng doanh thu của doanh nghiệp và các nguồn lực cần thiết cho từng luồng doanh thu đó.
Overview: kiến thức tổng quan về ngành, từ cung ứng sản xuất đến thị trường kinh doanh… tất cả kiến thức chuyên ngành tổng quan nhất sẽ giúp người làm dữ liệu phác thảo được bức tranh tổng quan nhất về doanh nghiệp và cách data có tác động đến hoạt động vận hành, kinh doanh.

2. Sử dụng ngôn ngữ lập trình Python/R

Với khối lượng dữ liệu ngày một lớn hơn trong thời đại 4.0, Excel đôi khi không đủ khả năng để lưu trữ hết dữ liệu, vì thế, việc phân tích sẽ gặp nhiều trở ngại trên Excel. Ngôn ngữ lập trình sẽ là giải pháp thay thế hoàn hảo giúp bạn giải quyết vấn đề trên. Mặc dù có những khác biệt nhất định, nhưng điểm chung của những loại ngôn ngữ này là giúp bạn xử lý khối lượng dữ liệu cực lớn trong thời gian nhanh hơn và với độ chính xác cũng cao hơn. Python/R tích hợp rất nhiều thư viện với các hàm được xây dựng sẵn để hỗ trợ công việc phân tích, trực quan hóa dữ liệu, thậm chí cả tự động hóa các tác vụ lặp đi lặp lại, giúp giảm đáng kể workload và mang lại kết quả phân tích đáng tin cậy hơn.
Hình 2: Ngôn ngữ lập trình Python/R
Hình 2: Ngôn ngữ lập trình Python/R

3. Kiến thức về thống kê (Statistics)

Hiểu biết về thống kê giúp người làm dữ liệu có được cái nhìn tổng quan về dữ liệu hiện có, xác định độ tin cậy của đối tượng được mang ra phân tích dựa trên các mẫu dữ liệu thu thập được. Nắm được các loại kiểm định thống kê cũng giúp ích rất nhiều nếu bạn muốn phân tích sâu về sự tương quan giữa các biến trong cùng một tập dữ liệu, hoặc xây dựng mô hình dự đoán một đại lượng nào đó.
Hình 3: Normal Distribution
Hình 3: Normal Distribution

4. Kiến thức về AI/ML/DL

Phân tích dữ liệu không chỉ đơn thuần là đánh giá tình hình hoạt động của tổ chức dựa trên dữ liệu có sẵn. Với sự phát triển chóng mặt của thế giới, ngày càng có nhiều sản phẩm ứng dụng công nghệ hiện đại như trí tuệ nhân tạo, học máy, học sâu để hỗ trợ con người trong công việc ở nhiều ngành nghề khác nhau (ví dụ mới đây nhất là ChatGPT). Dù bạn có trở thành nhân lực làm trong các chuyên ngành đó hay không, việc trau dồi kiến thức và tư duy về những lĩnh vực kể trên không bao giờ thừa và hoàn toàn có thể giúp bạn tăng năng suất làm việc lên đáng kể.
Hình 4: Kiến thức về AI/ML/DL
Hình 4: Kiến thức về AI/ML/DL

5. Tư duy giải quyết vấn đề - Problem Solving

Đây là một kỹ năng có lẽ là không ai không biết, nhưng cần được luyện tập và cải thiện liên tục qua thời gian. Là người làm dữ liệu, kỹ năng này thậm chí còn thuộc hàng quan trọng nhất vì bạn thường sẽ làm nhiều dự án khác nhau và phối hợp với nhiều phòng ban khác nhau, mỗi dự án sẽ tồn tại những câu hỏi cần tìm lời giải. Bạn cần vận dụng linh hoạt tất cả những kỹ năng, kiến thức đã, đang và sẽ có để chia nhỏ từng bài toán và tìm cách giải chúng.
Hình 5: Tư duy giải quyết vấn đề
Hình 5: Tư duy giải quyết vấn đề
Ngoài ra, còn rất nhiều kỹ năng tech (như SQL, Excel, Power BI,...) và non-tech (giao tiếp, làm việc nhóm,...) mà bạn cần học hỏi cũng như củng cố trong quá trình làm việc. Với một Data Analyst hay bất cứ ai làm việc trong ngành dữ liệu, việc cập nhật và trang bị thêm kỹ năng là điều tất yếu. Bộ kỹ năng của bạn càng đa dạng, bạn càng thích ứng tốt và có thêm nhiều cơ hội phát huy bản thân trong những môi trường làm việc lý tưởng.
----------------
Các kênh chia sẻ thông tin về Data Analyst của mình:
👉 Thảo luận với mình tại group chia sẻ chân thành về Data: https://bit.ly/vietnamdataanalystgroup
👉 Kênh Youtube Data Coaching: https://bit.ly/DataAnalystSharing
👉 Facebook Ngô Vinh: https://www.facebook.com/ngovinhdata
👉 Thông tin về khoá coaching:
https://bit.ly/DataAnalystCoaching1on1detail