Năm 1948 là một năm khó khăn đối với André-Georges Haudricourt. Mới trước đó một năm, luận văn ngôn ngữ học của ông vừa bị đánh trượt vì quá lập dị, rồi khi ông tới Việt Nam nghiên cứu thì lại rơi ngay vào một cuộc tranh cãi học thuật bất phân thắng bại: Tiếng Việt thuộc ngữ hệ nào? Bà con họ hàng của ngôn ngữ này là tiếng gì?
Suốt một thế kỉ trước đó, các nhà ngôn ngữ đã bất đồng về chuyện làm sao xác định được vấn đề này. Họ tranh cãi xem từ vựng chung hay thanh âm chung mới là quan trọng, rồi họ đưa ra những lập luận dựa trên giả thuyết của phe mình. Các học giả người Đức thì ngay từ đầu đã cho rằng tiếng Việt thuộc ngữ hệ Nam Á — thậm chí là ngôn ngữ phổ biến nhất của ngữ hệ này. Ngữ hệ Nam Á là một nhóm ngôn ngữ ở khu vực Đông Nam Á, ví dụ tiêu biểu là tiếng Môn, tiếng Khmer và tiếng Việt. Các nhà ngôn ngữ học này đã so sánh những cuốn sách cổ bằng tiếng Khmer và tiếng Môn, cũng như thu thập danh sách từ vựng của các tộc người thiểu số ở Malaysia, quần đảo Nicobar (Ấn Độ), những khu vực thuộc vùng sâu, vùng xa của Ấn Độ và Tây Nguyên của Việt Nam. Các ngôn ngữ này thường có hiện tượng khớp âm: những từ có nghĩa giống nhau trong các thứ tiếng khác nhau được phát âm giống nhau. Điều này thể hiện khá rõ trong các ngôn ngữ ở Đông Nam Á, cho thấy rằng chúng có họ hàng với nhau. Lập luận này rất phù hợp với lối suy nghĩ thịnh hành trong ngành ngôn ngữ học ở Đức, rằng những thứ tiếng này bắt nguồn từ một ngôn ngữ tổ tiên chung. Về mặt này, tiếng Việt nhất định thuộc về ngữ hệ Nam Á. 
Tuy nhiên, có một lý do chính đáng khiến người ta nghi ngờ liệu tiếng Việt có thực sự là một ngôn ngữ Nam Á hay không: thanh điệu. Không giống như từ ngữ, thanh điệu là một đặc tính quy mô lớn nên rất khó có thể mượn từ ngôn ngữ này sang ngôn ngữ khác. Vì vậy, khi xác định ngữ hệ, các học giả người Pháp coi trọng những đặc tính này hơn là so sánh cách phát âm của từ ngữ. Họ tranh luận rằng hầu hết các ngôn ngữ Nam Á đều không có hoặc có rất ít thanh điệu đối lập — ví dụ, tiếng Khmer và tiếng Môn đều không có thanh điệu. Trong khi đó, tiếng Việt hiện đại có tới sáu thanh, mà một số ngôn ngữ không thuộc hệ Nam Á ở gần đó, như tiếng Trung và tiếng Thái, lại cũng có hệ thống thanh điệu phức tạp. Hệ thống thanh điệu của ngữ hệ Tai (một ngữ hệ khác với hệ Nam Á, trong đó có tiếng Thái) đặc biệt rất giống với tiếng Việt. Từ đó, các nhà ngôn ngữ học này suy ra rằng tiếng Việt có liên quan với ngữ hệ Tai, có người còn cho rằng cả hai đều có họ hàng xa với tiếng Trung. 
Thế là khúc mắc về nguồn gốc của tiếng Việt trở thành một cuộc tranh chấp kéo dài đến gần một thế kỉ, từ những năm 1880 đến thập kỉ 1950. Khi Haudricourt bắt đầu tìm hiểu vấn đề này vào cuối thập kỉ 1940, là một học giả người Pháp, ông vốn có thể cứ đơn giản chấp nhận lập luận của trường phái ngôn ngữ học Pháp; thế nhưng ông lại đâm đầu vào núi tài liệu có độ tuổi lên tới cả thế kỉ, trong đó đầy rẫy những tuyên bố mâu thuẫn lẫn nhau về tiếng Việt. Ông thu thập bằng chứng về những dạng thức tiếng Việt xưa để tìm hiểu xem ngôn ngữ này vốn dĩ vẫn luôn có thanh điệu, hay đã trải qua thay đổi và trở thành như thế. Ông tìm được bản viết lâu đời nhất của tiếng Việt hiện đại: từ điển năm 1649 do Alexandre de Rhodes soạn, cuốn sách có ảnh hưởng rất lớn tới cách viết tiếng Việt ngày nay. Trong đó, Rhodes đã ghi lại một số từ có cách phát âm giống tiếng Mường hơn là tiếng Việt ngày nay, những từ này nghe rất giống với các ngôn ngữ Nam Á. Có khi, chúng có phụ âm vẫn được bảo lưu trong tiếng Mường hoặc các tiếng Nam Á khác, nhưng trong tiếng Việt ngày nay thì các phụ âm này đã trở thành thanh điệu.
Haudricourt phát hiện ra rằng thanh điệu trong tiếng Việt thực ra đã thay đổi và mở rộng qua nhiều thế kỉ, mà khởi nguồn là từ một ngôn ngữ tổ tiên không có thanh điệu. Tiếng Việt vốn cùng chung nguồn gốc không thanh điệu này với tiếng Khmer và vài chục ngôn ngữ Nam Á khác, nhưng về sau hệ thống phát âm của tiếng Việt đã thay đổi theo hướng giống như ngữ hệ Tai và tiếng Trung. Thực tế là, cả ba nhóm ngôn ngữ vốn không có họ hàng gì với nhau này — tiếng Tai, tiếng Trung và tiếng Việt — đều đã trải qua những thay đổi tương tự nhau, từ hệ thống ngữ âm không thanh điệu đến thanh điệu đơn giản rồi đến thanh điệu phức tạp như ta thấy ngày nay. Như vậy, tiếng Việt đúng là một ngôn ngữ thuộc hệ Nam Á. 
Công trình nghiên cứu của Haudricourt được công bố vào năm 1954 đã an bài cuộc tranh cãi ngôn ngữ học về tiếng Việt. Nghiên cứu này đã đưa ra những chứng cứ thuyết phục về nguồn gốc của tiếng Việt, hơn nữa còn giải thích vì sao tiếng Việt lại có nét tương đồng với các thứ tiếng láng giềng không cùng họ — bởi các ngôn ngữ này đã cùng thay đổi song song với nhau. Công trình này cũng chứng minh rằng học viện nào đó của Pháp lẽ ra nên trao bằng tiến sĩ cho Haudricourt, thay vì đánh trượt ông. (Ngày nay ở đó có cả một viện nghiên cứu được đặt theo tên ông.)
Dò tìm mối liên hệ giữa các ngôn ngữ họ hàng là bước đầu tiên để trả lời câu hỏi: Những ngôn ngữ này từ đâu ra? Trên thế giới hiện nay có khoảng 6000 ngôn ngữ, mỗi thứ tiếng đều có các quy luật ngữ pháp riêng và lượng từ vựng phong phú. Những quy luật ngữ pháp và từ vựng đó là đặc trưng của mỗi ngôn ngữ, nếu không phải là tiếng mẹ đẻ hoặc đã từng học qua thì người ngoài không thể hiểu được. Làm sao ngôn ngữ trở nên đa dạng như vậy? Ngôn ngữ, cũng như những người dùng chúng, hẳn là phải có nguồn gốc nào đó. Ngôn ngữ học, khi kết hợp cùng khảo cổ học và di truyền học, có một siêu năng lực tìm ra lịch sử của những thứ vốn chưa bao giờ được ghi lại. Không những ta có thể tìm hiểu xem người xưa nói thế nào, mà còn có thể biết được họ đã đi những đâu, sống thế nào, thay đổi ra sao. 
Tiếng Việt, cũng như bất kì ngôn ngữ nào khác, không phải là bất biến: từ ngữ, cách phát âm và quy tắc ngữ pháp trong tiếng Việt vẫn luôn thay đổi. Ta có thể nhìn thấy những thay đổi đó qua các giai đoạn lịch sử, thậm chí là trong thời gian gần đây. (Những tác phẩm văn học viết bằng tiếng Việt thời xưa, ngay cả khi đã được phiên âm và viết lại bằng tiếng Việt hiện đại, vẫn rất khó hiểu nếu không có chú thích hoặc dịch nghĩa.) Và bởi vì ngôn ngữ vốn do con người tạo ra và lan tỏa, những thay đổi trong các thứ tiếng theo dòng lịch sử thường gắn liền với người sử dụng chúng. Các nhà ngôn ngữ học như Haudricourt đã lần theo những thay đổi này, qua đó tìm kiếm những đặc điểm có thể cung cấp cho họ đôi chút manh mối về cuộc sống trong quá khứ của những người sử dụng thứ tiếng đó.
Sau đây bài này sẽ rẽ sang khảo cổ học và di truyền học. Đọc tiếp tại đây:
Về tác giả: Adam Johnson là một nhà sinh học có đam mê với ngôn ngữ học và rất hứng thú khi hai ngành này gặp nhau ở cùng một chỗ. Anh tốt nghiệp ngành ngôn ngữ học từ Đại học Colorado và tiến sĩ ngành sinh học từ Đại học Missouri, Columbia. Anh đã làm việc tại Đại học Duy Tân (Đà Nẵng) trong 3 năm và hiện đang làm nghiên cứu di truyền tại New York.  Tố Linh là một người kể chuyện về khoa học bằng cách viết báo, blog và sách truyện. Cô tốt nghiệp thạc sĩ ngành sinh học và giáo dục từ Đại học Missouri, Columbia.