Bạn có thể nghe thấy mọi người nói rất nhiều về big data, data-driven, ra quyết định dựa trên số liệu… Bạn cảm thấy đó dường như là cuộc chơi của các doanh nghiệp lớn, có luồng dữ liệu lớn, và có các chuyên gia thống kê chuyên nghiệp. Nhưng liệu, doanh nghiệp vừa và nhỏ của bạn có thể bắt đầu tham gia cuộc chơi data này ngay?
Client gần đây của tôi là một khu du lịch A, nằm ở tỉnh B. Trong buổi trao đổi, họ khá hài lòng với thông điệp truyền thông cho năm sắp tới, các kênh triển khai và ngân sách mà chúng tôi đề xuất. Tôi chắc mẩm đây sẽ là một buổi họp ngắn gọn và thành công. Nhưng đột nhiên, vị giám đốc của họ quay sang phía tôi và hỏi:
– Chúng tôi rất hài lòng, nhưng chỉ có một băn khoăn duy nhất. Thông qua phỏng vấn cá nhân (in-depth interview) và social media listening, chúng tôi có lắng nghe được khách hàng phàn nàn rằng mức giá vé vào khu du lịch của chúng tôi quá cao. Theo các anh, nếu giảm mức giá từ 350,000 VNĐ xuống còn 300,000 VNĐ, thì phản ứng của khách hàng sẽ ra sao? Nói cách khác, liệu số du khách sẽ tăng lên bao nhiêu?
Câu hỏi khiến account director của tôi khựng lại một chút. Sau một hồi ngẫm nghĩ, anh trả lời rằng khách hàng rằng:
– Tôi nghĩ sẽ là khoảng 20%
– Tại sao cậu nghĩ vậy? – vị khách hàng tò mò hỏi lại
– Ừ hừm, chỉ là phán đoán thôi. Tôi từng có 10 năm kinh nghiệm với các client ngành du lịch trong vùng này.
Quả thật, câu trả lời với 10 năm kinh nghiệm của mình, account director của chúng tôi đã khiến client tạm hài lòng (hoặc không thể chưa hài lòng nhưng tạm chấp nhận). Tuy nhiên điều này khiến tôi hơi băn khoăn đôi chút, liệu có cách nào có thể khiến client hoàn toàn hài lòng với câu trả lời không. Chỉ có một cách duy nhất: chứng minh bằng số liệu. Data không nói dối. Trong trường hợp này để dự đoán phản ứng của khách hàng với các mức giá, tôi sẽ sử dụng một phép toán rất nổi tiếng: Hàm hồi quy tuyến tính.
Chúng tôi bắt tay vào phỏng vấn giám đốc kinh doanh của client, CEO, CFO, rất nhiều khách hàng, để đưa ra các yếu tố ảnh hưởng đến lượng du khách. Thậm chí là khi di chuyển taxi tôi cũng tranh thủ đặt câu hỏi với người lái xe về du lịch địa phương. Kết quả, tôi có được hàm hồi quy:
Lượng khách hàng trong tháng = B1.Giá vé + B2.Tổng lượng mưa trong tháng + B3.Lượng khách quốc tế đến tỉnh B + B4. Lượng khách nội địa đến tỉnh + B5. Lượng khách đến khu du lịch bên cạnh + Ɛi
(Trong hàm hồi quy trên, Giá vé, Tổng lượng mưa, Lượng khách quốc tế, lượng khách nội địa, lượng khách của khu du lịch bên cạnh, là các yếu tố ảnh hưởng đến tổng lượng khách trong tháng)
Như vậy, nhiệm vụ của tôi sẽ là lấp đầy dữ liệu vào bảng dưới đây bằng dữ liệu trong quá khứ (hiện tại là tháng 10, nên tôi sẽ tìm dữ liệu của 9 tháng trước đó). Sau đó là sử dụng hồi quy trên excel, để tìm ra các ẩn số B1, B2, B3, B4, B5, từ đó dự đoán lượng khách các tháng trong tương lai.
Đây quả là một nhiệm vụ khó khăn. Lượng mưa là dữ liệu dễ nhất, tôi sử dụng dữ liệu trên accuweather.com và trang web của cục khí tượng thủy văn http://www.nchmf.gov.vn.
Giá và lượng khách của 9 tháng trước là dữ liệu client có sẵn, nhưng quả là phải rất nỗ lực, cộng với nhiều công sức giải thích, họ mới chấp nhận cho chúng tôi truy cập dữ liệu này.
Còn dữ liệu khách du lịch quốc tế (inbound) và nội địa (domestic)? Số liệu này nằm ở đâu đó ở Sở kế hoạch đầu tư và Sở Văn hóa Thể thao du lịch Tỉnh. Bằng rất nhiều cuộc gọi “nhờ vả”, cuối cùng tôi cũng có được bảng báo cáo… bằng Word dài gần 200 trang được trình bày theo phong cách tương đối nhà nước, tuy nhiên dữ liệu khá tốt.
Và phần khoai nhất, dữ liệu lượng khách của “hàng xóm”. Tôi vẫn xin được số liệu, với bài học rút ra là: Hãy sống tốt với hàng xóm, vì sẽ có lúc bạn cần nhờ họ giúp đỡ.
Phần hồi quy còn lại khá đơn giản trên excel, với số lượng mẫu N=9 (tương đương với 9 tháng). Kết quả thực sự bất ngờ, độ chính xác của hàm hồi quy là 94,38% !!!. (Nhân tiện, nếu bạn nào cần hướng dẫn chi tiết thao tác sử dụng hàm hồi quy trên excel, bạn có thể click vào đây).
Giá trị R bình phương càng cao càng cho thấy mô hình sử dụng có khả năng giải thích tốt sự biến động của biến phụ thuộc. Ở đây, R bình phương đạt tới 94,38% !!!
Với các kết quả B1, B2, B3, B4, B5, tôi dễ dàng dự đoán được lượng khách trong tháng 10. Khá hồi hộp, tôi nhấc máy lên và thông báo kết quả dự đoán của tháng 10. Và vị khách hàng đã thật sự bất ngờ và phấn khích: “OMG, cậu làm thế nào để biết được con số đó? Tình hình thực tế của chúng tôi đang tiến gần đến con số đó”.
Đó là một dự án thành công tương đối mỹ mãn. Sau dự án này, tôi có rút ra được một vài kinh nghiệm khi tập chơi data:

1, Chơi data là bạn đang đi trước đối thủ

Trước khi bắt tay vào xây dựng dashboard dự báo, tôi có gọi 2 cuộc điện thoại. Một cuộc cho đồng nghiệp cũ tại một công ty đa quốc gia của Nhật (bạn biết đấy, người Nhật suy nghĩ cực logic), và một cho người bạn tại một công ty FMCG lớn của Việt Nam. Tôi hỏi họ: tại công ty của anh, người ta có dùng… kinh tế lượng để dự đoán phản ứng của khách hàng tại mỗi mức giá không. Thật ngạc nhiên, họ đều trả lời là không.
Đó là một tin xấu, tôi không hề có người đi trước để hướng dẫn. Nhưng đó cũng là tin tốt: Ngay cả các công ty lớn, đủ lớn để phát sinh luồng dữ liệu chất lượng, họ cũng gặp khó khăn khi xử lý data để ra quyết định. Tức là các đối thủ trực tiếp của tôi cũng gặp khó khăn như thế. Càng hoàn thiện các dashboard với nhiều luồng dữ liệu, chúng tôi càng có nhiều cơ sở cho quyết định của mình

2, Data không hề khó như bạn nghĩ

Rõ ràng động lực đầu tiên để gia nhập ngành Marketing đều là vì sự sáng tạo và hấp dẫn của nó, chứ không phải là khía cạnh khô khan của những con số. Nếu ở phía client, bạn chắc chắn sẽ làm việc với con số nhiều hơn, nhưng nếu là dân creative, mọi chuyện sẽ có vẻ khó khăn.
Đặc biết khi nhìn bảng data raw của client dài… gần 300 cột và 50 dòng. Nhưng hóa ra mọi chuyện không hề phức tạp như tôi tưởng. Tôi chỉ mất một ngày để đọc hiểu và xử lý chúng, sau đó là bắt tay vào phân tích.

3, Dù không hề khó, nhưng chơi data đòi hỏi nhiều nỗ lực

Nỗ lực đầu tiên là bạn phải giải thích với khách hàng, đồng nghiệp về tầm quan trọng của chúng, từ đó bạn được trao quyền truy cập dữ liệu. Ngay cả tại các công ty có kiểu truyền thông nội bộ “open” như các công ty Nhật (everybody to know everything), thì tôi vẫn gặp một vài khó khăn khi truy cập các dữ liệu hơi nhạy cảm.
Điểm tiếp theo là bạn không được phép dễ dãi với những con số mình có được. Như ví dụ ở trên, chúng tôi có thể dễ dãi sử dụng dữ liệu tổng khách du lịch đến tỉnh B, thay vì phải vất vả tách ra thành khách nội địa và khách quốc tế. Sở dĩ như vậy, vì trong các buổi phỏng vấn CMO, CEO của client, và các buổi in-depht interview, chúng tôi khẳng định được rằng “khẩu vị” của du khách quốc tế rất khác so với du khách nội địa.
Nếu bạn sử dụng data theo cách nửa vời, không đi đến tận cùng con số đó nói gì; hay kết luận vội vã, mọi chuyện có thể còn nguy hiểm hơn cả ra quyết định dựa trên cảm tính.
Dĩ nhiên khi mới bắt đầu “lái” doanh nghiệp của mình theo hướng “data-driven”, sẽ có rất nhiều trở ngại. Tuy nhiên, thành quả cũng rất ngọt ngào. Bạn sẽ có nhiều dữ kiện hơn, ra quyết định về Marketing “chắc tay” hơn, và có khả năng tận dụng cơ hội trước đối thủ kinh doanh.  
*Bài viết dựa trên câu chuyện có thật. Các tên gọi và tình tiết được thay đổi để đảm bảo bí mật danh tính của người trong cuộc
Link bài gốc được đăng trên blog của Markus
Một vài bài viết khác của mình, về Marketing, and working political: