Xin bạn đọc lưu ý: nghiên cứu ngôn ngữ học xếp tiếng Việt vào tiểu nhánh Môn-Khmer của hệ ngữ Nam Á không có nghĩa là tiếng Việt là nhánh con của các ngôn ngữ Môn-Khmer, mà có cùng một nguồn gốc với các ngôn ngữ thuộc nhánh này, chúng đều có nguồn gốc từ vùng Dương Tử, sự tương đồng ngôn ngữ bắt nguồn từ quá trình hình thành và phát triển của hệ ngữ Nam Á trong vùng trung lưu Dương Tử, sau đó các dân tộc thuộc hệ ngữ Nam Á đã phân tán đến vùng Đông Nam Á lục địa, hình thành các dân tộc thuộc hệ ngữ Nam Á ngày nay. (Xin chú ý, vùng Dương Tử lúc này là địa bàn lưu trú của cụm dân cư các tộc người Việt cổ, nên nguồn gốc này không liên quan gì tới Trung Quốc mặc dù vùng này ngày nay đã thuộc miền Nam Trung Quốc.)
Sự phân tán các hệ ngữ Nam Á, Nam Đảo, Tai-Kadai, Hán-Tạng (Oxford University press)
Sự phân tán các hệ ngữ Nam Á, Nam Đảo, Tai-Kadai, Hán-Tạng (Oxford University press)
Lướt qua các từ điển bách khoa toàn thư thông dụng (1) thì giới ngôn ngữ học xếp tiếng Việt vào tiểu nhánh Môn-Khmer thuộc họ ngôn ngữ Nam Á (Austroasiatic), do đó gắn tiếng Việt vào nhóm có nguồn gốc chung với hơn 160 ngôn ngữ sử dụng trên toàn lục địa Đông Nam Á(2). Tuy nhiên, có những người phản bác lại quan điểm này. Họ đưa ra cách phân loại khác, và xếp tiếng Việt vào cùng nhóm ngôn ngữ Vùng Nam Đảo, hoặc nhóm ngôn ngữ thanh điệu Tai-Kadai(3), hay Hán(4). Yếu tố làm cho việc xếp tiếng Việt với nhóm Môn-Khmer khó có thể chứng minh một cách chắc chắn là kho từ vựng rất phong phú của tiếng Việt bao gồm từ có gốc thuộc các hệ ngôn ngữ Nam Á, Hán, Tai-kadai, và ở mức độ ít hơn, là hệ ngôn ngữ Vùng Đảo Nam Á – Thái Bình Dương. Hơn nữa, loại hình ngôn ngữ học của tiếng Việt, một ngôn ngữ đơn âm và có thanh điệu, làm cho giả thiết về nguồn gốc Nam Á của nó thậm chí còn mờ nhạt hơn, vì các ngôn ngữ Môn-Khmer thường có hai âm tiết và đồng thời không có thanh điệu. Chỉ có việc áp dụng các công cụ tái hiện chuyên dụng trong ngành Ngôn ngữ học lịch sử thì nguồn gốc Môn-Khmer của tiếng Việt mới có thể được minh chứng một cách rõ ràng hơn.
Trong thực tế, tuy đa số các chuyên gia ngôn ngữ ở Việt Nam nhất trí với quan điểm xếp tiếng Việt vào hệ ngữ Nam Á(5), các bản đồ chính thức của Việt Nam có ghi phân bố địa lý của các nhóm dân tộc thiểu số [1] kèm theo các nhóm ngôn ngữ của họ cho thấy việc xếp loại tiếng Việt vẫn chưa dứt khoát, tuy tiếng Việt và tiếng Mường liên quan với nhau, nhưng ám chỉ rằng hai ngôn ngữ này ít nhiều có nguồn gốc khác hẳn với tất cả các nhóm ngôn ngữ khác ở Việt Nam. Sự không chắc chắn kéo dài này là đáng kể vì tiếng Việt có số lượng người sử dụng lớn nhất khu vực Đông Nam Á bên cạnh các ngôn ngữ lục địa khác (khoảng 82 triệu). Do vậy, việc xem xét lại những bằng chứng đã đưa ra để ủng hộ các giả thiết đối ngược nhau là điều cần làm.
Tuy phần lớn những ý tưởng được trình bày trong bài viết này có thể đã được tổng hợp một phần ở nhiều tài liệu khác nhau, nhưng cho đến thời điểm này, chưa có một công trình nghiên cứu nào tập hợp đầy đủ các lý lẽ biện minh cho giả thiết Môn-Khmer và bác bỏ các quan điểm đối chọi khác. Mục đích của bài này là mô tả khái quát và tránh đi sâu vào chuyên môn (và những thuật ngữ-định nghĩa cần thiết đều được chú giải) các kết quả nghiên cứu ngôn ngữ lịch sử và những tranh luận về cách phân loại tiếng Việt dựa trên nhiều giả thiết khác nhau (chẳng hạn như tiếng Việt có chung nguồn gốc với những ngôn ngữ nào?). Nhìn chung, trên cơ sở áp dụng thận trọng phương pháp nghiên cứu chuẩn mực của ngành ngôn ngữ học lịch sử và và xét đến những bối cảnh di trú và tương tác giữa các sắc tộc có khả năng xảy ra thì giả thiết tiếng Việt bắt nguồn từ nhóm Môn-Khmer vẫn là khả quan nhất. Đúng vậy, bằng chứng ủng hộ cho giả thiết này cũng chính là loại bằng chứng mà người ta thường dựa vào để chứng minh nguồn gốc chung của các ngôn ngữ. Hơn nữa, giả thiết này còn cho thấy một hiện tượng thú vị của việc một ngôn ngữ phát triển từ phi thanh điệu sang có thanh điệu và đồng thời rút gọn từ đa âm xuống đơn âm tiết.
1. Tóm tắt lịch sử nghiên cứu về nguồn gốc tiếng Việt
Bản tóm tắt đầy đủ nhất các nghiên cứu đầu tiên về nguồn gốc ngôn ngữ học lịch sử của tiếng Việt là từ một bài viết của William Gage[2, 493-524]. Vấn đề phả hệ của nguồn gốc ngôn ngữ học của tiếng Việt bắt nguồn từ đầu thế kỷ 19, khi Giám mục Jean-Louis Taberd lần đầu tiên tuyên bố rằng tiếng Việt là một biến thể của tiếng Hán. Sau đó, vào năm 1856, James Logan gợi ý rằng “tiếng An-nam” là một bộ phận của họ ngôn ngữ Môn-Khme mà ông gọi là “cấu trúc Môn-An nam”. Chắc chắn quan điểm này mang tính suy đoán vì khối lượng dữ liệu khi đó còn rất hạn chế[2], và đến đầu thế kỷ 20, quan điểm này dần trở thành thách thức. Năm 1912, sử gia đồng thời là nhà nghiên cứu ngôn ngữ học nổi tiếng người Pháp là Henri Maspéro đã viết một chuyên khảo trong đó ông khẳng định rằng tiếng Việt thuộc nhóm ngôn ngữ Tai[3]. Mãi tới giữa thế kỷ 20 một nhà ngôn ngữ học người Pháp khác, André Haudricourt, xuất bản ba bài viết [4-6] nhằm cung cấp căn cứ ngôn ngữ học, theo đó tiếng Việt có thể được chứng minh một cách thuyết phục là có nguồn gốc thuộc hệ ngôn ngữ Nam Á cả trên cơ sở dữ liệu về từ vựng lẫn cả âm vị(6). Từ đó, các nghiên cứu về đề tài này chủ yếu tập trung vào các mối quan hệ giữa tiếng Việt với nhóm Môn-Khmer. Michel Ferlus [7,8], Gage[2], Gerard Diffloth[9,10], Nguyễn Văn Lợi[11] và Nguyên Tài Cẩn [12] đã đưa ra một số ấn phẩm quan trọng nhất về vấn đề này và các công trình của nhiều học giả khác đã cung cấp thêm các bằng chứng hỗ trợ. Tuy nhiên, trong con mắt của một số học giả, một số yếu tố phức tạp làm cho vấn đề này vẫn chưa được giải quyết.
2. Công cụ lý thuyết của Ngôn ngữ học lịch sử
Giống như trong khảo cổ học, các phương pháp tiếp cận trong ngành ngôn ngữ học tuỳ thuộc vào tính thuyết phục của các bằng chứng và các giả thiết hợp lý(7). Suy cho cùng, những suy đoán về quá khứ xa xưa không thể có sự chắc chắn tuyệt đối, nhưng có thể dựa trên các dữ liệu về ngôn ngữ, văn hoá, lịch sử hiện có có thể đưa ra các giả định lô-gic và loại trừ một số khả năng không thể xảy ra. Sử dụng các thông tin như vậy, người ta có thể trình bày quan điểm về cơ cấu ngôn ngữ học của các ngôn ngữ trong quá khứ (được gọi là “phục nguyên”), tương tác giữa các ngôn ngữ và các nhóm ngôn ngữ (ví dụ sự vay mượn các thành tố từ vựng và cấu trúc ngôn ngữ), các mối quan hệ phả hệ ngôn ngữ học (ví dụ mối quan hệ với một họ ngôn ngữ nhất định). Hai thành tố cơ bản cho phép các nhà nghiên cứu xếp hai ngôn ngữ vào một họ ngôn ngữ là (1) một bộ từ vựng cơ bản chung, và (2) các bộ âm tương xứng lặp lại nhiều lần giữa hai ngôn ngữ (ví dụ một âm trong một ngôn ngữ giống hệt hay tương tự như một âm trong nhiều từ cùng gốc [tức là các từ có chung nguồn gốc] thuộc một ngôn ngữ khác, do đó tạo ra một mô hình tương xứng). Thời gian quá xa xưa có thể làm cho một số vấn đề trở nên đáng nghi ngờ vì đã trải qua nhiều thay đổi, tuy nhiên ngay như vậy thì mô hình tương xứng về âm vị cũng cần đủ hoàn chỉnh để có thể phục nguyên một ngôn ngữ nguyên thuỷ, tức là một ngôn ngữ trong quá khứ mà từ đó các ngôn ngữ liên quan được hình thành. Ngoài ra, khi điều kiện cho phép, các chi tiết về lịch sử, khảo cổ, và/hoặc nhân chủng học cần cung cấp các bằng chứng bổ sung và các kịch bản khả thi để giải thích cho việc một ngôn ngữ tách thành nhiều ngôn ngữ.
Thuật ngữ “từ vựng cơ bản” vừa có tính khách quan, vừa rất ấn tượng, song đối với các hệ ngôn ngữ đã hình thành vững chắc như Ấn – Âu, một hệ liên kết các ngôn ngữ có phạm vi địa lý rộng lớn như tiếng Hindi và tiếng Anh, và hệ Hán – Tạng, một nhóm gồm hơn hai trăm ngôn ngữ khác nhau[13,14], bao gồm cả những ngôn ngữ mà tên gọi của nó đã nói nên phần nào bản chất, tiếng Hán và tiếng Tây Tạng – thì thuật ngữ này có thể minh hoạ dễ dàng. Từ vựng cơ bản gồm các loại từ của một ngôn ngữ ít có khả năng mất đi trong thời gian hàng thế kỷ hay thiên niên kỷ và có nhiều khả năng tồn tại trong thời gian dài hơn các loại từ vựng không phải là cơ bản khác. Những từ có thể được xem là thực sự cơ bản bao gồm các, các bộ phận của cơ thể, các hiện tượng thiên nhiên và động vật thông thường, và các hành vi/hoạt động cơ bản, ngoài các loại ngữ nghĩa thông thường khác và các khía cạnh về sự tồn tại của con người. Đây chính xác là các từ mà chúng không chỉ liên kết các ngôn ngữ Môn-Khme thành một hệ ngôn ngữ, mà còn liên kết chúng với ngôn ngữ tiếng Việt. Trong khi xác định các mối liên kết ngôn ngữ học, các từ có ngữ nghĩa chung chung hơn hữu ích(8) hơn các từ có nghĩa cụ thể hơn nhưng lại gắn với các từ thuộc các nhánh nhỏ trong phạm vi các chủng loại rộng hơn. Ví dụ, từ con chim [bird], một từ nguyên Môn-Khme nói tới cả một phạm trù ngữ nghĩa, trong khi từ bồ câu [pigeon], có thể có gốc từ ngôn ngữ Tai-Kadai, chỉ một loài chim cụ thể, mà nó làm cho từ nguyên Môn-Khme càng hữu ích hơn. Từ vựng cơ bản có xu hướng đề kháng với các giao lưu ngôn ngữ vừa phải (tức là giao lưu giữa các nhóm dân tộc dẫn đến những thay đổi về ngôn ngữ), một tình huống diễn ra một số vay mượn từ vựng(9). Điều này làm cho chủng loại từ vựng cơ bản trở nên hữu ích hơn cho việc xác định nguồn gốc ngôn ngữ chung của các ngôn ngữ. Cuối cùng, môn thống kê từ vựng học, tức là việc đánh giá mức độ sử dụng chung từ vựng cơ bản giữa các ngôn ngữ, là một công cụ bổ trợ có thể sử dụng để xác định mức độ liên hệ giữa các ngôn ngữ và đánh giá được phần nào các bằng chứng của nguồn gốc ngôn ngữ. Phương pháp thống kê thẳng thắn này hẳn có thể là nền tảng của các nghiên cứu sau này, nhưng không nhất thiết đưa đến kết quả chắc chắn bởi vì ngôn ngữ vay mượn từ vựng và đôi khi với số lượng lớn.
Bằng chứng về sự cùng nguồn gốc của hai ngôn ngữ liên quan đến việc xác định mô hình âm vị của hai âm đối lập và song song nhau. Hơn nữa, nếu xuất hiện càng nhiều ví dụ về các mô hình như vậy, thì lập luận về tình trạng cùng nguồn gốc càng vững chắc. Ví dụ, tìm được vài ví dụ về các từ có âm răng /d/ trong một ngôn ngữ và âm răng /n/ trong một ngôn ngữ khác sẽ củng cố thêm lập luận rằng hai ngôn ngữ này ít nhiều có liên hệ với nhau, dù có thể nói chắc chắn về các quan hệ phả hệ hay giao tiếp giữa hai ngôn ngữ này hay không. Để xác định cùng nguồn gốc phả hệ, sự tương xứng về âm vị giữa các bộ từ vựng cơ bản trong hai ngôn ngữ cần bao gồm đủ các mục từ vựng để phục nguyên các hệ thống âm hoàn chỉnh và, lý tưởng nhất là một dạng phục nguyên văn hoá xã hội nào đó (tức là sự phục nguyên một hệ thống văn hoá và cách sống chứ không chỉ là hệ thống ngôn ngữ) dựa trên từ vựng cơ bản. Việc này cũng đòi hỏi phải so sánh các giai đoạn trước đó đã được phục nguyên của các nhóm ngôn ngữ chứ không chỉ là hai ngôn ngữ trong dạng hiện đại của chúng. Có được các từ cùng gốc với sự tương xứng về âm vị trong nhiều ngôn ngữ khác nhau, kể cả các ngôn ngữ xa nhau về địa lý (do đó giảm bớt khả năng vay mượn), có thể củng cố thêm lập luận về cùng nguồn gốc phả hệ. Nếu không có loại bằng chứng này, các lập luận đó sẽ kém thuyết phục hơn.
Trong khi việc xác định kho từ vựng cơ bản và sự tương ứng âm vị đều đặn vẫn là cơ sở để đánh giá cùng nguồn gốc ngôn ngữ, trong trường hợp cụ thể của tiếng Việt, cần có thêm tiêu chuẩn để giảm bớt hơn nữa tính không chắc chắn có thể xẩy ra. Một trong các nguy cơ của Sprachbund, hay gọi là vùng ngôn ngữ, như Đông Nam Á, là từ ở các ngôn ngữ khác nhau lại có thể giống nhau về cả âm vị và ngữ nghĩa do sự giống nhau về tượng hình trong các hệ thống âm vị và chức năng ngữ nghĩa, ngữ pháp, chức năng ngôn ngữ thực tiễn nhưng vẫn chưa hình thành các từ nguyên liên hệ với nhau. Hiện tượng “từ cùng gốc giả” hay “trông giống nhau”, các trường hợp giống nhau ngẫu nhiên về âm vị hay ngữ nghĩa là một vấn đề rắc rối nổi bật trong ngôn ngữ học Đông Nam Á vì nhiều ngôn ngữ ở vùng này có số từ đơn âm đáng kể, ngoài những giống nhau về tượng hình khác. Có xu hướng là một số từ nhất định hay loại từ nhất định rất phổ biến trong các ngôn ngữ ở khu vực này, như vùng ngôn ngữ Đông Nam Á, nơi có nhiều hoạt động giao tiếp giữa các nhóm dân tộc đến mức chúng thực sự làm giảm khả năng của chúng ta trong việc thiết lập cùng nguồn gốc phả hệ. Trường hợp này phổ biến trên toàn thế giới đối với trường hợp từ “mẹ”, một từ thường bắt đầu bằng âm /m/, hay từ “bố” thường bắt đầu bằng âm /f/ hay một âm tương tự. Ở Đông và Đông Nam Á, những từ tương tự nhau trong nhiều hệ ngôn ngữ gồm các từ diễn đạt “mắt” hay các từ chỉ định “này/kia”, và trên cơ sở các dữ liệu hiện có hay về phương pháp luận chưa có thể nói được liệu các trường hợp giống nhau này hay những trường hợp khác là kết quả của những nguồn gốc xa xưa hơn giữa các hệ ngôn ngữ hay đơn thuần chỉ là các giao lưu ngôn ngữ.
Tốt nhất là loại trừ những từ có thể có nhiều nguồn gốc ngôn ngữ, hay ít nhất thừa nhận chúng là bằng chứng kém thuyết phục hơn của lập luận về nguồn gốc giữa các họ ngôn ngữ riêng biệt, một quan điểm ít được xem xét đến trong các nghiên cứu lịch sử ngôn ngữ ở Đông Nam Á. Điều cốt yếu là phải xem xét yếu tố địa lý, như trường hợp Bắc Việt Nam, khi kiểm tra những liên quan về từ vựng có thể có với các ngôn ngữ láng giềng – mà không coi trọng nhóm này hơn nhóm kia – bởi vì vùng này là một mắt xích địa lý giữa Trung Quốc, lục địa Đông Nam Á với vùng đảo Đông Nam Á. Cuối cùng, hiện tượng tượng thanh là một vấn đề nữa làm suy yếu lập luận về từ cùng nguồn gốc; ví dụ tiếng Việt có từ cắt [cut] cũng như các dạng ngữ âm tương tự của cùng một từ trong các ngôn ngữ Môn-Khme (ví dụ tiếng Khme kat), tiếng Tai (ví dụ tàt), và tiếng Trung Quốc phía nam (ví dụ tiếng Quảng Đông chit[15]). Một phương pháp tiếp cận bảo thủ hơn có thể gồm rất nhiều các từ cùng gốc nhưng sau đó loại bỏ hay xử lý cẩn thận tới mức có thể theo các tiêu chí loại bỏ nhất định (xem danh mục dưới đây). Như vậy, những dữ liệu còn lại có thể có nhiều giá trị chứng minh cho nguồn gốc ngôn ngữ hơn. Các tiêu chí để xác định nguồn gốc ngôn ngữ có thể gồm:
1.Số lượng từ vựng cơ bản (toàn bộ)
2.Các mô hình tương xứng về âm vị của từ vựng cơ bản (toàn bộ)
3.Số lượng các ngôn ngữ trong một hệ ngôn ngữ có từ gốc chung (toàn bộ)
4.Các khả năng đa dạng trong các hệ ngôn ngữ khác nhau (loại trừ)
5.Tính chất tượng thanh (loại trừ)
Ngoài phương pháp luận chung được mô tả ở trên, các kịch bản về lịch sử của sự di cư và giao lưu của con người cũng phải được xem xét. Nếu bằng chứng ngôn ngữ cho thấy hai ngôn ngữ có chung bối cảnh lịch sử thì bằng chứng này gợi ra mối quan hệ dân tộc nào? Trước những dữ liệu lịch sử có được thì các giả thiết vững chắc đến đâu, và ta đã biết được gì về các hoàn cảnh ngôn ngữ, xã hội và địa lý? Mặc dù các nghiên cứu như vậy hẳn mang tính phỏng đoán, tính vững chắc của mỗi giả thiết về nguồn gốc ngôn ngữ khi nói về con người phải được xem xét ít nhiều.

•Chú thích:

(1) Ví dụ Encyclopedia Britannica, MSN Encarta và từ điển bách khoa toàn thư trên mạng internet tại địa chỉ: http://www.Wikipedia.org
(2) Để có thêm số liệu về các ngôn ngữ Môn-Khme, số người sử dụng các ngôn ngữ này và vị trí địa lý của họ, xem địa chỉ website của Viện Ngôn ngữ học mùa Hè, cơ sở dữ liệu “Ethnologue” (www.ethnologue.com) một tập hợp khổng lồ, mặc dù phần nào vẫn chưa hoàn chỉnh, các ngôn ngữ trên thế giới. Để đọc thêm các nghiên cứu ngôn ngữ học về hệ ngôn ngữ Môn-Khme và các tiểu nhánh, hãy truy cập trang web của Paul Sidwell (Trường Đại học Tổng hợp quốc gia Ô-stơ-rây-lia), http://www.anu.edu.au/%7Eu9907217/languages/language s.html (truy cập ngày 24/5/2006).
(3) Từ “Tai-Kadai” nói tới ba nhánh của một họ ngôn ngữ hoàn chỉnh, gồm Kam-Tai, Kadai và Htai. Trong bài viết này, từ được sử dụng chung là “Tai”, mô tả một tiểu nhóm thuộc tiểu nhóm Kam-Tai. Không nên nhầm lẫn “Tai” với “Thái” (có thêm chữ h), là ngôn ngữ quốc gia của Thái – lan và chỉ là một trong 50 ngôn ngữ Tai.
(4) Từ ‘Hán” trong bài viết này nói tới một nhóm ngôn ngữ có liên quan với nhau – một vài nhóm lớn (ví dụ: tiếng Trung quốc phổ thông, tiếng Yue, Min v.v.) mà mỗi một thứ tiếng có hàng chục thổ ngữ hoặc các biến thể địa phương – chứ không phải để chỉ một biến thể nhất định của tiếng Hán.
(5) Thực ra đây là một ý kiến mang tính dự đoán, song có vẻ là ý kiến chung của các nhà ngôn ngữ tại Viện Ngôn ngữ học Hà nội và hầu hết các nhà nghiên cứu ngôn ngữ ở các trường đại học khác của Việt Nam. Để xem các ý kiến về chủ đề này, hãy truy cập vào trang web của Viện Ngôn ngữ học Hà Nội (www.ngonngu.net) trong đó nêu sự chấp nhận về nguồn gốc Nam Á của tiếng Việt.
(6) Trong một bài báo của mình viết năm 1954 “Nguồn gốc thanh trong tiếng Việt” Haudricourt cũng đưa ra giả thiết về nguồn gốc của các thanh điệu trong tiếng Việt, một học thuyết có tác động lớn đến công tác nghiên cứu ngôn ngữ học lịch sử về các ngôn ngữ Đông và Đông Nam Á.
(7) Một khác biệt quan trọng giữa ngành khảo cổ tự nhiên và ngôn ngữ học lịch sử là trong khảo cố, tuổi của các cổ vật được đánh giá bằng niên đại các – bon. Ngôn ngữ học lịch sử suy cho cùng là một ngành không có công cụ chẩn đoán. Công cụ đánh dấu niên đại khách quan gần nhất là các lưu trữ về chữ viết, nhưng chỉ trong trường hợp niên đại của các tài liệu này có thể xác minh được.
(8) Từ điển từ nguyên và từ đồng nghĩa Hán – Tây Tạng, phần “Giới thiệu” http://stedt.berkeley.edu/ (accessed May 24, 2006).
(9) Cụm từ “more useful – hữu ích hơn” ở đây nên được hiểu với nghĩa tương đối. Bởi vấn đề là sức nặng của bằng chứng, nên rất có thể là một số từ vựng phần nào ít cơ bản hơn lại có thể là có cùng nguồn gốc. Các ý kiến cực đoan về bất kỳ phía nào cũng không hợp lý, nhưng chúng tôi hy vọng rằng việc tích luỹ các chi tiết đủ để bảo vệ một quan điểm nào đó.
(10) Nói chính xác hơn, tiếng Hán là một nhóm ngôn ngữ. Hai người mà nói những phương ngữ Trung Quốc khác, ví dụ tiếng Bắc kinh và tiếng Quảng đông, không có thể hiểu nhau trừ khi họ có học phương ngữ Trung Quốc khác.
(11) Ví dụ là muôn /ten thousand/, từ Hán cổ của chữ HánViệt vạn và y /he-she/, chữ Hán .
(12) Những bằng chứng như vậy là kết quả của việc so sánh với nhiều ngôn ngữ Môn-Khme. Trong một số trường hợp, những từ như “fish – cá” và “leaf – lá” thậm chí có quan hệ rộng lớn hơn với các nhóm ngôn ngữ khác trong vùng (“fish – các” trong ngôn ngữ vùng Nam Đảo, và “leaf – cá” trong cả ngôn ngữ Hán – Tây tạng và ngôn ngữ vùng Nam Đảo), nhưng chỉ những nghiên cứu có tính chất hệ thống áp dụng phương pháp phê phán mạnh mẽ mới có thể xác định được điều này một cách chắc chắn hơn. Hơn nữa, một số lượng ít ỏi từ có thể là cùng gốc sẽ không đủ cơ sở để xác định liệu vấn đề này là sự giao tiếp về ngôn ngữ hay nguồn gốc ngôn ngữ chung. Laurent Sagart thậm chí đưa ra quan điểm về sự quan hệ lâu đời giữa các ngôn ngữ Hán- Tây tạng, Nam Á và Tai-Kadai.
(13) Jerry Norman đã đưa ra một danh sách rất hay về các từ nguyên Hán – Tây Tạng; không một từ nào trong danh sách này có vẻ có từ cùng gốc tương ứng trong vốn từ vựng bản địa của tiếng Việt.
(14) Công trình ngôn ngữ học lịch sử hoàn chỉnh nhất về Hán – Việt, với ý kiến thảo luận đầy đủ về truyền thống âm vị lịch sử của tiếng Hán.
(15) Các từ điển gieo vần cho thấy các chủng loại phát âm chữ Hán thuộc triều đại Đường và Song. Sự nhận biết chính xác về các âm được trình bày có thể được suy ra chỉ bằng việc so sánh những chủng loại này với các biến thể hiện đại của tiếng Hán, một đề tài nghiên cứu ngôn ngữ học lịch sử từ cuối những năm 1800.