Lời mở đầu
Xin chào, tôi là Dương AQ, một writer đời đầu trên Spiderum từ 2017. Tuy nhiên có thể ít bạn biết đến tôi với tư cách là một người dạy về Excel/PBI nói riêng và dữ liệu nói chung. Hiện tại, tôi đã có 7 năm kinh nghiệm giảng dạy cho các ngân hàng và doanh nghiệp lớn như Vietcombank, Vietinbank, VNPT, FPT soft... Trong series này, tôi muốn chia sẻ với các bạn tầm quan trọng của Kỹ năng phân tích dữ liệu, và tại sao việc làm dữ liệu không chỉ nằm ở cách sử dụng công cụ. Trong bài viết này chúng ta cùng đến với câu chuyện ứng dụng kỹ năng phân tích dữ liệu vào việc lập báo cáo biến động nhân sự (trong ngành HR) nhé.
nguồn ảnh: sưu tầm
nguồn ảnh: sưu tầm

Mục tiêu của báo cáo biến động nhân sự

Cách đây 2 năm, có một chị học viên trong lớp Excel cho Nhân sự của tôi (tạm gọi là chị H) có nhờ tôi hỗ trợ làm báo cáo phân tích tình hình biến động nhân sự cho công ty. Khi ấy cũng vào khoảng cuối tháng 12, chỉ còn khoảng 1 tuần nữa là phải nộp báo cáo, trong khi chị làm mãi không xong. Nói thêm một chút về công việc của chị: chị đang làm trưởng phòng nhân sự ở một công ty với quy mô 400-500 người. Bài toán chị đưa ra (hay nói đúng hơn là của sếp chị đưa ra) là dựa trên dữ liệu nhân sự 3 năm gần nhất, đưa ra các báo cáo quản trị nhân sự như:
+ Thống kê tình hình nhân sự hiện tại (headcount),
+ Đánh giá tình hình biến động nhân sự: tuyển mới, nghỉ việc, nguyên nhân, xu hướng của tình hình này.
+ Đưa ra các giải pháp, kế hoạch cho năm tiếp theo để cải thiện tình hình.

Vấn đề gặp phải

nguồn ảnh: databox
nguồn ảnh: databox
Khi xem thử file Excel mà chị đang làm, tôi mới hoảng hồn bởi vì nó rất lộn xộn, không theo một bài bản, quy trình gì cả. Việc này khiến tôi mất khá nhiều thời gian để tìm hiểu, nắm bắt được đặc thù dữ liệu trong ngành này. Thời gian không có nhiều, mà làm trên file đang dang dở của chị thì tôi chịu. Do đó tôi đành phải làm trên file mới và cố gắng tìm ra hai vấn đề chính:
1. Đặc điểm dữ liệu đang có như thế nào?
2. Chị cần những kết quả gì? hay cần trả lời những câu hỏi gì?
Một số vấn đề với dữ liệu của chị là:
- Dữ liệu của 3 năm nên được lưu trữ trên nhiều file excel chứ không phải trên cùng 1 bảng tính duy nhất. Việc này khiến kỹ thuật báo cáo thông thường trên excel không đáp ứng được (như dùng Pivot Table hay dùng hàm). Để làm được theo cách thông thường thì phải gom (gộp) dữ liệu các năm lại về cùng 1 bảng. Việc này cũng khá mất thời gian và công sức, lại dễ sai sót nữa.
- Vấn đề thứ hai là cấu trúc các bảng không thống nhất: số lượng cột không đều, tên tiêu đề mỗi bảng một kiểu… khiến việc tập hợp dữ liệu dễ sai sót. Khi hỏi chị thì tôi mới biết được nguyên nhân là: không phải một người duy nhất thu thập, quản lý dữ liệu này mà do nhiều người, nhiều đời HR rồi. Mà mỗi người lại tư duy một kiểu, cần báo cáo gì thì mới thu thập dữ liệu đó. Chính "tư duy nhiệm kỳ" này khiến người đi sau rất vất vả khi phải tiếp nhận dữ liệu của người làm trước đó.
- Vấn đề thứ ba là dữ liệu thiếu, sai sót rất nhiều, mà như thế thì sẽ không thể cho ra báo cáo đúng được. Chưa kể những người có thông tin sai, thiếu cũng đã không còn làm việc nữa, rất khó để bổ sung. Thế nhưng cũng không thể tự ý bịa ra thông tin cho những người này được, bởi làm thế sẽ khiến kết quả báo cáo không đúng với tình hình thực tế.
Những vấn đề này thật sự rất khó để giải quyết trong một thời gian ngắn, bởi đó đều là những lỗi nghiêm trọng trong tư duy và quy trình quản lý dữ liệu tại doanh nghiệp, đặc biệt là những doanh nghiệp vừa và nhỏ (dựa vào số lượng nhân sự công ty chị thì mới ở mức vừa). Họ chưa có bộ phận riêng để phụ trách vấn đề này. Những người phụ trách chính (như chị H) cũng chưa hiểu đúng về tầm quan trọng của việc phải tổ chức thu thập, lưu trữ, xử lý dữ liệu một cách có hệ thống. Lại thêm tư duy “nhiệm kỳ”, không có tính kế thừa cho những người sau này thay thế vị trí công việc của mình nên không đồng bộ, không có quy trình bài bản.
Một số vấn đề với kết quả là:
- Đầu tiên tôi hỏi chị có mẫu báo cáo năm trước không để tham khảo, chị bảo không có. Năm nay sếp mới yêu cầu làm. Tôi cũng không lạ gì với chuyện này, bởi bản thân tôi cũng từng trải qua những tình huống tương tự. Phải làm những việc chưa bao giờ làm, không có sự chuẩn bị, không rõ cần kỹ năng hay công cụ gì. Thế nhưng lại không được phép từ chối bởi nó nằm trong phạm vi công việc của mình.
- Tiếp theo tôi nhận ra là những yêu cầu này khó hơn tôi nghĩ. Một số vấn đề mà tôi gặp rắc rối khi đó như: 1 mã nhân sự xuất hiện trong nhiều tháng, làm sao để khi tính toán sẽ chỉ coi đó là 1 mã duy nhất (bỏ qua được sự trùng lặp)? Làm sao kết hợp được bảng dữ liệu về định biên nhân sự với số nhân sự hiện có để so sánh, vì đây là hai nguồn dữ liệu khác nhau?
- Việc lựa chọn biểu đồ nào để thể hiện kết quả cũng phải đắn đo rất nhiều. Đâu phải cứ chọn bừa, vẽ bừa một cái biểu đồ là xong đâu. Tôi phải thảo luận với chị, sửa đổi nhiều lần mới ra được kết quả tốt nhất. Bởi có những biểu đồ tôi cho là hay thì chị lại không biết cách đọc, hay gửi cho sếp thì sếp cũng không hiểu vì chưa dùng loại biểu đồ đó bao giờ. Việc lựa chọn biểu đồ, biểu diễn báo cáo cũng phải phù hợp với người sử dụng thì mới đạt được hiệu quả cao nhất.
- Một vấn đề nữa là tôi buộc phải làm trên Excel chứ không được dùng công cụ khác. Nếu như việc này được làm trên Power BI thì sẽ dễ hơn và nhanh hơn nhiều. Tuy nhiên khi tôi hỏi chị có biết sử dụng Power BI không thì chị bảo không, thế là đành chịu. Để làm trên Excel thì lại phải chú ý tới các phiên bản khác nhau, tới việc phải cài đặt các add-in như Power Query, Power Pivot vì không phải Office trên máy tính nào cũng giống nhau hay có sẵn các add-in này. Đây chính là sự hạn chế về công nghệ, rất khó thay đổi ngay lập tức.
(Nếu bạn nào chưa biết về Power BI thì mình sẽ giải thích thêm chỗ này một chút: Power BI được phát triển từ gốc là Excel với các công cụ chính là Pivot Table, Pivot Chart, add-in Power Query, Power Pivot để chuyên sâu cho việc xử lý dữ liệu, xây dựng mô hình dữ liệu để phân tích và trực quan hóa dưới dạng dashboard. Khi chuyển sang sử dụng Power BI sẽ có lợi thế là không phụ thuộc vào bộ Office, sử dụng dễ dàng hơn, dùng được trên nhiều thiết bị, lại thường xuyên được cải tiến, nâng cấp nên hiệu quả cũng lớn hơn nhiều so với làm trên Excel)

Giải quyết như thế nào?

Với các vấn đề về dữ liệu, tôi phải sử dụng Power Query để kết nối và làm sạch dữ liệu. Đây được gọi là quy trình LTE (Load-Transform-Extract). Điều này có vẻ khá là mới lạ so với những gì chúng ta hay làm trên excel. Khi dùng Power Query, chúng ta sẽ phải làm việc trên môi trường khác, với những công cụ khác. Một ưu điểm rất lớn của Power Query đó là nó giúp chúng ta có thể ghi lại những Step (từng bước) của cả quy trình xử lý dữ liệu. Nhờ đó chúng ta có thể dễ dàng kiểm tra, chia sẻ cho người khác để cùng làm việc một cách dễ dàng. Nếu sai sót ở bước nào thì chỉ cần chỉnh sửa ở bước đó mà không cần phải làm lại toàn bộ quy trình, nhờ đó cũng dễ dàng hơn trong việc cập nhật, thay đổi sau này. Việc ghép nối dữ liệu từ nhiều bảng, nhiều nguồn cũng được thực hiện rất dễ dàng trong Power Query. Trước đây tôi hay phải sử dụng VBA để làm việc này. Tuy nhiên học code VBA khá là khó và lâu, chưa kể gặp những tình huống phức tạp như cấu trúc bảng không đồng nhất thì xử lý rất mất thời gian mà hiệu quả lại không cao. Khi dùng sang Power Query tôi thấy thời gian để học và làm được nhanh hơn rất nhiều so với VBA, mà với các step rõ ràng, chúng ta chẳng cần phải biết code vẫn có thể làm được, sửa được quy trình.
(Tương tự như khi sử dụng Power BI để kết nối dữ liệu, bạn cũng sẽ thực hiện các bước LTE trong môi trường Power Query Editor được tích hợp sẵn)
Về kết quả báo cáo, tôi và chị phải thảo luận với nhau nhiều lần để làm rõ các mục tiêu, giải thích các thuật ngữ, công thức tính toán trong công việc của chị. Đó là những thứ mà người không làm việc thực tế sẽ không tài nào biết được. Không chỉ hiểu được mục tiêu tính toán, tôi cần phải sử dụng DAX (Data Analysis Expressions - là các hàm trong Power Pivot, cũng gần giống với các hàm trong Excel nhưng phương thức hoạt động phức tạp hơn) để chuyển mục tiêu bằng lời thành những công thức tính toán cụ thể giúp tính ra các chỉ số (hay còn gọi là Measures hoặc Calculated Fields). DAX hoạt động trong mô hình dữ liệu (data model) chứ không chỉ trên 1 bảng duy nhất. Cơ chế tính toán của nó khá là khó hiểu. Bạn có thể hình dung nó giống như một khối rubik, khi bạn xoay 1 mặt thì nó sẽ tác động tới nhiều mặt khác. Tuy nhiên kết quả của DAX lại rất ấn tượng: kết quả chính xác hơn và cũng nhanh hơn so với cách dùng hàm Excel thông thường. Chúng ta có thể bóc tách số liệu, đánh giá theo những bối cảnh cụ thể, đặc biệt là với những hàm Time Intelligence giúp đánh giá, so sánh dữ liệu theo thời gian rất hiệu quả. Những yêu cầu phân tích như so sánh cùng kỳ (tháng trước, năm trước…), tính theo chu kỳ (7 ngày, 30 ngày…) hay tính lũy tiến, cộng dồn được thực hiện rất dễ dàng và linh hoạt. Nó đáp ứng được hầu hết các yêu cầu báo cáo mà chị H đang cần làm.

Những kết quả thu được

Mất gần 1 tuần chúng tôi mới hoàn thành được bản báo cáo. Bản thân chị H thấy rất tự tin với kết quả này, vì nó vượt xa kỳ vọng ban đầu của chị. Khi nghe chị kể rằng Sếp của chị cũng đánh giá cao về phương pháp cũng như kết quả báo cáo thì tôi mới thực sự nhẹ nhõm và vui, vì điều đó chứng minh những gì tôi đã dành nhiều công sức học tập, nghiên cứu và làm việc đã có kết quả xứng đáng. Khối lượng công sức và thời gian bỏ ra lâu hơn dự kiến của tôi bởi có quá nhiều vấn đề cần phải hệ thống lại, cần nhiều thời gian trao đổi, bàn bạc để hiểu và thống nhất trong cách giải quyết. Nhưng vẫn công việc này, tới năm tiếp theo (2022) thì chúng tôi chỉ mất 2 giờ làm việc, dù quy mô dữ liệu lớn hơn và có thêm vài yêu cầu nữa, và khá bất ngờ là tới năm nay (2023) chúng tôi chỉ cần 15 phút để làm xong mọi thứ.
Tại sao lại có sự rút ngắn thời gian dù khối lượng dữ liệu và yêu cầu nhiều hơn? Bởi vì chị H đã có được phương pháp thu thập và quản lý dữ liệu theo đúng quy trình, nhờ đó chúng tôi không cần phải làm lại bước này. Dữ liệu cứ tự động được kết nối, thông qua quy trình LTE đã được thiết lập sẵn trong Power Query, rồi tự kết nối tiếp vào mô hình (data model), các hàm DAX tự động tính toán và báo cáo tự động được cập nhật chỉ với một thao tác refresh giản đơn. Chúng tôi chỉ mất thời gian kiểm tra lại kết quả, xử lý thêm những yêu cầu mới phát sinh thêm mà thôi.
Chị H bảo với tôi là: Cách này hay thật, nếu không làm theo phương pháp này thì chắc năm nào chị cũng mất vài tuần đau đầu với cái báo cáo này mất. Trong khi đó thời điểm cuối năm công việc rất nhiều, mà việc nào cũng phải hoàn thành cả.
Tôi trả lời lại là: thực ra thời gian cho báo cáo này, với mức độ này của chị thì cũng chỉ cần khoảng 15-20 phút là đủ. Tuy nhiên nếu không có công cụ, không có sẵn quy trình thì sẽ phải làm lại từ đầu, mà như thế thì lâu lắm, làm cả ngày không xong. Mà toàn bộ công việc này nếu làm trên Power BI thì còn tốt hơn nữa, bởi nó được thiết kế ra để làm những việc như thế này mà.

Một vài điều rút ra

1. Điều đầu tiên tôi nhận ra là sự chủ động học, tìm hiểu kiến thức mới, công cụ mới. Bởi bạn sẽ chẳng thể biết khi nào sếp yêu cầu bạn làm một báo cáo "khó" hay một việc bạn chưa làm bao giờ. Điều đó cũng không hẳn là "tại sếp", mà do nhu cầu công việc, do cạnh tranh, do thay đổi công nghệ... do rất nhiều nguyên nhân buộc chúng ta phải nâng cấp bản thân thì mới đáp ứng được, nếu không tự chúng ta sẽ trở nên lỗi thời, lạc hậu và dễ bị đào thải. Mà đợi tới khi có yêu cầu mới học, mới tìm hiểu thì muộn mất rồi. Tôi dám chắc rằng nếu tôi gửi một đống tài liệu cho chị H tìm hiểu, tự làm thì chị cũng không thể làm được tại thời điểm đó.
2. Cái khó nhất của việc phân tích dữ liệu trong kinh doanh là hiểu được mô hình kinh doanh. Người không làm nghề nhân sự như tôi, dù có biết làm BI thành thạo thì cũng không đưa ra đúng ngay được báo cáo mà HR cần. Vẫn phải được trao đổi, học hỏi từ chị H rất nhiều và cố gắng làm đúng những gì được yêu cầu. Vậy nên cách học hiệu quả nhất vẫn là có những tình huống thực tế, có những người nhiều kinh nghiệm để trao đổi với họ, cùng họ giải quyết vấn đề.
3. Kỹ năng phân tích dữ liệu có thể được ứng dụng trong nhiều ngành nghề, dùng nhiều công cụ để làm. Ngoài việc ứng dụng trong phân tích dữ liệu nhân sự, tôi cũng ứng dụng trong phân tích dữ liệu về Digital marketing, trong bán hàng trên sàn Thương mại điện tử, hay để quản lý tài chính, quản lý công việc. Có thể sử dụng đồng thời trên Excel hay trên Power BI cũng được. Ngoài ra còn nhiều công cụ nữa như Python, Tableau, Google Data studio... nhưng phổ biến nhất vẫn là Excel và Power BI.
---
03/01/2024
duongAQ
---
Nếu bạn đã cất công đọc tới tận đây thì tôi xin phép bạn thêm 5 giây dành cho quảng cáo:
1. Khóa học "Mastering Power BI - từ tư duy đến thực hành phân tích dữ liệu".
2. Khai giảng 10/01/2024.
3. Nhanh tay đăng ký, được ưu đãi học phí.
4. Chi tiết xem tại:
5. Cảm ơn!