Sẵn tiện vừa viết một bài dài để trả lời một bạn hỏi về ứng dụng của machine learning vào mảng HR/talent sourcing, nên copy-paste lại lên thành status luôn để khoe ahihi
Theo như t đọc thấy thì bây giờ đang công nghệ làm nổi lên input mới (talent social network) và tools/systems mới (AI) để ứng dụng vào business model cũ (talent sourcing & matching - employers pay, employees get jobs)
Thiệt ra t cũng không rành hết các khâu của business model này, nên t nghĩ tốt nhất là sẽ  
1. giải thích AI trước (vì những người rành business model này sẽ nghĩ ra được cách áp dụng tốt hơn t)
2. đưa ra một vài gợi ý về cách áp dụng;
3. cuối cùng mới bàn tới implementation (resources, risks, feasibility) 
thì sẽ hợp lí hơn.
Vậy thì

1. AI là gì? 

T nghĩ AI là một dạng cao hơn của xác suất thống kê để tìm mối quan hệ giữa một số independent variables và một dependent variable. nói vậy thì đúng là rất trừu tượng và rất bao quát, bởi vì nó hoàn toàn áp dụng được vào tất cả mọi thứ - nhưng mà để áp dụng được thì phải hiểu nó là gì.
T nghĩ mọi người cũng làm luận án rồi - nên t dùng analogy là làm luận án nhé. Thường thì quy trình làm luận án có các bước:
- Bước 1: đưa ra một giả thuyết gì đó về một mối quan hệ (uống sữa làm tăng chiều cao)
- Bước 2: tìm data có liên quan tới giả thuyết đó (danh sách một 100,000 người, kèm tần suất uống sữa, chất lượng sữa blah blah, và chiều cao của họ hiện tại)
- Bước 3: phân tích và nghiên cứu data bằng cách lựa chọn công cụ phù hợp (thường là làm luận án sẽ dùng statistics)
- Bước 4: đưa ra kết luận sau khi phân tích dựa trên giả thuyết ban đầu
Vậy thì AI cũng là một công cụ để phân tích data thôi - là một dạng cao cấp của statistics. Mà đúng thật, trên mặt lí thuyết, thì AI là một chuyên ngành của statistics - chứ thật ra cũng không cao siêu gì. Tức là, nếu c muốn ứng dụng AI, thì nó chỉ giúp c vào Bước 3 phân tích; chứ các bước còn lại c vẫn phải làm

2. Biết được AI chỉ là một công cụ để phân tích data, làm sao để ứng dụng vào talent sourcing?

Vẫn phải làm các Bước 1, 2, 4. Một ví dụ:
- Bước 1: C đưa ra giả thuyết là những người viết resume giống nhất với job description thì sẽ dễ được match (hire) hơn là reject (no hire)
- Bước 2: C nghĩ cách tìm data để verify/falsify cái giả thuyết đó. Ở đây, suy nghĩ một hồi thì data cần có là a) resume của một đống người b) job description mà những người đó đã ứng tuyển c) kết quả ứng tuyển (hire/no hire). Data này có thể đã có sẵn internally (ví dụ Adecco đã match nhiều người và các kết quả đều có lưu lại ở một database nào đó), externally (ví dụ một công ty nào khác đã thu thập các data này và sẵn sàng bán/chia sẻ lại cho Adecco), hoặc là chưa có và bây giờ phải đi thu thập (chuyện thu thập ntn lại là chuyện khác)
- Bước 3: Có data đó rồi, thì c có thể dùng AI để xem có cách nào a) resume b) job description (JD) gây ảnh hưởng lên c) hire/no hire không.
Chẳng hạn, khi trước khi có AI, người ta sẽ phải ngồi đếm coi giữa resume và JD có bao nhiêu câu từ giống nhau, giống nhau bao nhiêu phần trăm - nhưng như vậy thì sẽ rất hạn chế, vì giữa resume và JD còn có thể có những quan hệ khác không thể đo được một cách đơn giản như vậy. Đồng thời, vì statistics rất hạn chế, nên kết luận đưa ra cũng hạn chế, chẳng hạn "Tăng độ giống nhau giữa resume và JD lên 30% thì tăng xác suất matching lên 10%"
Bây giờ AI là một cách tốt hơn để tìm mối quan hệ giữa variable (ví dụ như natural language processing có thể "đọc hiểu" resume và job description), vậy thì sẽ đưa ra được một kết luận hữu dụng hơn, chẳng hạn hữu dụng đến mức chỉ cần có resume và job description thì c có thể predict được kq hire/no hire với độ chính xác 75% khi so với kq của employer sau phỏng vấn.
- Bước 4: Trình bày kết luận trong business context thì c sẽ phải trình bày internally với project manager & leadership để dự án của c được cho thêm budget và mở rộng blah blah; và externally với khách hàng bằng cách đưa ra proposal để bán cái kết luận vừa tìm được nhờ AI.
Trong trường hợp cũ, dùng statistics, thì cái kết luận "Tăng độ giống nhau giữa resume và JD 30% thì tăng tỉ lệ match 10%" không thể commercialize, hoặc commercialize một cách rất hạn hẹp (ví dụ như viết một cái whitepaper để tăng branding).
Nhưng có AI, thì c có thể bán cái predictive model (input resume & job description; output matching result/suggestion). Ví dụ như bán với giá US$15,000 một năm nhưng mà thay thế được 5 HR analyst với lương US$12,000 một năm mỗi người - vậy là khách hàng cũng có lời (vì giảm được chi phí HR analyst) và c cũng có lời (vì cái AI predictive model có thể bán được cho nhiều người)
Nhưng đây là một ví dụ rất chủ quan, và đã đơn giản hoá rất rất nhiều. Đồng thời ví dụ này cũng dựa trên hiểu biết vô cùng hạn hẹp của t về talent sourcing; và hiểu biết hơi-bớt-hạn-hẹp-một-chút của t về AI.
Sau đó mới nhảy ra...

3. Resources & investments 

Nhìn 4 bước trên thì thấy resources của AI cũng tương tự với resources cần có khi làm luận án. Tức là, có thể nhảy ra những resources cơ bản sau:
- Dataset: Cái này không phải ai cũng có.
Đã vậy, dataset yêu cầu thường rất lớn. Ví dụ muốn dùng natural language processing (NLP) thì chắc phải tầm 100,000 resume + job description + matching result. T đoán đại thế, chứ cũng chưa làm NLP bao giờ. C có thể tìm thêm OpenAI để đọc thêm nếu muốn.
Chưa kể, dataset cần phải "sạch", tức là có format thống nhất, không ẩn chứa bias (racial bias, gender bias, survivorship bias, etc.).
- Subject matter knowledge: C đang muốn ứng dụng AI vào talent sourcing, thì AI là công cụ, talent sourcing là subject matter. Tại sao phải cần subject matter knowledge? Vì có nó, c mới biết được data thế nào là tốt, data trong HR có những điểm yếu điểm mạnh gì, có thể đưa ra những giả thuyết gì, etc.
- Expertise knowledge: Đương nhiên cũng cần một người có kiến thức technical về AI. Như vậy thì ngta mới biết dùng tool nào trong cái AI toolbox rất rộng này để ứng dụng tốt nhất vào subject matter/business problem của c. 
Chẳng hạn, NLP là một mảng specialization trong AI, nhưng mà cũng có thể làm nguyên một cái master degree chỉ chuyên về NLP. Đồng thời, hiểu biết về tool thì mới biết tool cũng có thể dùng sai, biết điểm mạnh và điểm yếu của tool, etc.
- Tiền: đương nhiên, dùng để thu thập data; trả công cho subject matter expert (như c) và AI expert (như mấy ông giáo sư AI); để có máy móc vận hành AI; để commercialize AI (làm marketing, sales, proposal, etc.)

4. Risks & feasibility

T cũng đã nói sơ qua về risks ở các Phần 1., 2., 3. rồi. Mỗi bước trong bốn bước trên đều có risk của nó, cũng khá intuitive.
- Bước 1: Đưa ra giả thuyết, có thể faulty vì có bias của người đưa ra giả thuyết. Chẳng hạn, c đưa ra giả thuyết là "tăng độ giống nhau giữa resume và job description (A) thì sẽ tăng matching (B)" - nhưng:
- có thể là (B) ảnh hưởng (A) - chẳng hạn những người có resume giống nhất với JD sẽ thường apply hơn và vì thế có nhiều match hơn; 
- hoặc (C) ảnh hưởng cả (A) và (B), chẳng hạn con ông cháu cha vừa được bày cách viết resume vừa được ưu tiên khi match. 
Thậm chí, có khi (B) không phải cái mà c cần tìm - matching không phải là cái c muốn improve, mà là employee happiness (?) hoặc productivity (?) hoặc loyalty (?). Vậy nên rất cần subject matter expertise để tránh risk này.
- Bước 2: Tìm dataset cũng có thể faulty. Chẳng hạn gần đây nhất là vụ Amazon vô tình discriminate minority in hiring process chỉ vì trong dataset có ít minority applicant hơn. Hoặc là dataset rất "dơ" - không chuẩn format blah blah Để tránh risk này thì cần cả technical expertise và subject matter knowledge.
- Bước 3: Khâu phân tích cũng có thể faulty. Có thể NLP không phải là công cụ tốt nhất để verify/falsify cái giả thuyết của c - vì natural language data rất là messy (qualitative) nên predictive power ít hơn là quantitative data như số năm kinh nghiệm, lịch sử lương bổng blah blah. Khâu này thì cần nhiều technical expertise hơn.
- Bước 4: Khâu commercialization/presentation cũng có thể faulty - cái này thì c làm proposal nhiều rồi chắc sẽ rành hơn t nên t không nói sâu nữa.
Ahuhu viết nửa tiếng dài vl mà chỉ đào sâu vào đúng một ví dụ về cách áp dụng AI vào talent sourcing. Ngoài ra có thể ứng dụng khác, ví dụ như:
a) để thu hút và liên lạc applicant: chatbot? personalized outreach emails?
b) để thu hút và liên lạc với employer: automated proposal?
c) để improve matching: automate salary negotiation?
Nhưng mà cuối cũng thì t nghĩ có subject matter expertise sẽ nghĩ ra được ứng dụng hay hơn.