3. Tiếng Hán(10)
Sự giao tiếp về văn hoá của người Việt với người Trung Quốc có từ hơn hai ngàn năm trước đây: một ngàn năm đô hộ của Trung Quốc, một ngàn năm của thân phận chư hầu phải cống nạp và sự giao lưu văn hoá với các cường quốc phía bắc. Như nói ở trên, giả thiết về nguồn gốc phả hệ của tiếng Việt với tiếng Hán có từ thời thuộc địa và có vẻ vẫn còn rơi rớt trong các giả thiết phổ biến. Quan điểm như vậy bởi chủ yếu dựa vào số lượng rất lớn từ vựng tiếng Hán dễ nhận thấy trong tiếng Việt, những nét giống nhau quan trọng về loại hình ngôn ngữ giữa hai ngôn ngữ và ít nhất tới đầu thế kỷ XX việc sử dụng chữ viết Hán trong tiếng Việt (song song với chữ Nôm dựa trên cách viết của tiếng Hán).
Tuy nhiên, những khía cạnh này đều có vấn đề. Từ ngữ có thể được vay mượn, và chính là loại từ dùng chung, chứ không chỉ là số lượng, củng cố các giả thiết về nguồn gốc chung. Tiếp theo, trong khi cả tiếng Hán và tiếng Việt đều có thanh điệu, thì các ngôn ngữ lân cận như Tai-Kadai và Hơ-mông – Miên cũng có. Cuối cùng, chữ viết (một sản phẩm của con người có thể lưu truyền và không phải là một khả năng di truyền) chung cho cả hai ngôn ngữ rõ ràng không phải là một chỉ thị của nguồn gốc ngôn ngữ gốc; chỉ có ngôn ngữ nói được đại diện bằng chữ viết là có thể sử dụng được cho mục đích này. Một điều quan trọng nữa cần phải lưu ý là những giống nhau giữa tiếng Việt và tiếng Hán không nhất thiết là kết qủa của ảnh hưởng của tiếng Hán. Một số nét giống nhau có thể là kết quả của khu vực địa lý bất kể hệ ngôn ngữ nào, hay những sự giống nhau cũng có thể là kết quả của những thay đổi tự nhiên nội tại của ngôn ngữ. Ít nhất, nói rằng thực trạng hiện nay của tiếng Việt được xác định chỉ bằng những giao tiếp với tiếng Hán là quá đơn giản hoá sự việc [16, 221-242].
Trong khi việc xem xét những nét giống nhau nổi bật giữa tiếng Việt và tiếng Hán rất lý thú và quan trọng, việc xem xét những nét không giống nhau hay những gì trong tiếng Việt không bắt nguồn từ tiếng Hán cũng quan trọng không kém. Đặc biệt chúng ta phải nhận ra các yếu tố cần thiết để xác lập nguồn gốc ngôn ngữ giữa tiếng Việt và tiếng Hán. Trừ một số ít tài liệu và các trường hợp chuyên biệt, không một đại từ hay số từ nào trong tiếng Việt có nguồn gốc từ tiếng Hán(11). Những từ biểu đạt các hiện tượng thiên nhiên thực sự cơ bản cũng không xuất phát từ tiếng Hán, ví dụ từ chó /dog/, chim /bird/, củi /firewood/, nước /water/, lá /leaf/, rễ /root/ và một số từ khác, mà trong thực tế có nguồn gốc từ hệ Môn-Khme(12). Nói chung, những loại từ vựng cơ bản gắn kết nhiều biến thể khác nhau của tiếng Hán thành một nhóm ngôn ngữ hầu như không có trong tiếng Việt(13). Về ngữ pháp, trật tự danh từ trong cụm từ tiếng Việt đặt danh từ trước từ bổ nghĩa (một đặc tính có cả trong ngôn ngữ Môn-Khme và Tai ở khu vực này) nhưng ngược lại, tiếng Hán từ bổ nghĩa đứng trước danh từ. Quả vậy, loại từ vựng mà tiếng Việt vay mượn từ tiếng Hán phần lớn chính là loại từ vựng mà các ngôn ngữ thường vay mượn nhau: đó là từ vựng chỉ các vật dụng mang tính văn hoá cụ thể và các biểu đạt về văn hoá (ví dụ các dụng cụ trong gia đình, các vật dụng hay khía cạnh về y tế, về cơ quan quản lý của chính phủ, và nghệ thuật), và không phải là từ vựng cơ bản là các từ tương đối có sức chống lại việc vay mượn.
Thay vì các từ có nguồn gốc chung với tiếng Hán, tồn tại các tầng từ vay mượn từ tiếng Hán. Những nhà nghiên cứu như Vương Ly[17], Haudricourt [6], Đào Duy Anh[18] và các tác giả khác có sử dụng truyền thống âm vị lịch sử của tiếng Hán đã xác định được một tầng cổ xưa của từ vựng Hán từ Triều đại nhà Hán (năm 206 trước Công Nguyên đến 220 sau Công Nguyên), bằng cách xác định các mô hình thay đổi trong các phụ âm đầu và thanh điệu. Những từ như “kind/type”, “paper” và “well”cho thấy mô hình của âm vòm ban đầu và thanh sắc[19] được minh hoạ trong Bảng 1. Những từ như vậy thường được người Việt xem là một phần của chữ Nôm truyền thống, chữ viết biểu đạt tiếng Việt nói, chứ không phải là chữ Hán. Điều này trái ngược với một tầng từ vựng vay mượn sau này từ tiếng Hán thuộc triều đại nhà Đường (năm 618 – 907), được gọi là Hán – Việt, trong đó mỗi từ là một chữ viết Hán (Hán tự) phát âm kiểu Việt.
Điều quan trọng là phải lưu ý rằng truyền thống ngữ âm học lịch sử Hán phải được tính tới để thiết lập sự chắc chắn về nguồn gốc của các từ cho mượn xa xưa này(14). Nếu không ứng dụng các nghiên cứu ngôn ngữ học lịch sử về các “từ điển gieo vần” tiếng Hán(15) ngược trở lại thời gian khoảng một ngàn năm trăm năm và các nghiên cứu liên quan về các biến thể hiện đại của tiếng Hán cũng như cách đọc chữ Hán của người Nhật và người Triều tiên, thì không thể có được lập luận xác đáng về nguồn gốc ngôn ngữ với tiếng Hán. Trong một số trường hợp, thông qua việc vay mượn lẻ tẻ từ ngữ của một ngôn ngữ khác, các từ riêng biệt có thể thay đổi hình thái âm vị của chúng một cách thường xuyên, song hiện tượng các mô hình tượng hình chung và tự nhiên lặp đi lặp lại nhiều lần của những thay đổi về âm thì phải được xác định để chứng minh cho một trường hợp khả thi nào đó.
Hiện nay, với sự ứng dụng phương pháp luận ngôn ngữ học lịch sử một cách lô-gic, bất kỳ một lập luận nào cho rằng tiếng Việt có nguồn gốc từ tiếng Hán và vì thế có quan hệ với hệ ngôn ngữ lớn hơn là Hán – Tây tạng, là không có cơ sở.
4. Hệ ngôn ngữ Tai-Kadai
Tuyên bố hùng hồn nhất về nguồn gốc Tai của tiếng Việt do Maspéro đưa ra trong một bài viết dài 120 trang đăng trên tạp chí L’École Francoise d’Extrême – Orient(16). Trong bài viết đó, Maspéro chỉ ra khoảng một trăm từ mà ông coi là có cùng nguồn gốc chung giữa tiếng Việt và tiếng Tai-Kadai. Mặc dù ông cũng thừa nhận các từ cùng nguồn gốc Môn-Khme trong tiếng Việt, nhưng ông cho rằng dựa trên số từ nguyên Tai rõ ràng và các đặc tính âm vị chung (như thanh điệu và cơ cấu âm tiết đơn âm là phổ biến), tiếng Việt thuộc hệ ngôn ngữ Tai. Tuy nhiên, Haudricourt[5] chỉ ra rằng một số lượng đáng kể hình thái mà người ta cho là ngôn ngữ Tai trong thực tế có nguồn gốc từ tiếng Hán. Hơn nữa, có thể thấy rằng dữ liệu của Maspéro bộc lộ nhiều trường hợp là bằng chứng kém thuyết phục về từ vựng và âm vị, như các trường hợp từ tượng thanh (ví dụ mèo [cat]), hay các hình thái được thấy trong các ngôn ngữ ở khắp vùng Đông Nam Á, như đã được nêu trong phần nói về các công cụ lý thuyết của ngôn ngữ học lịch sử. Một khả năng phức tạp khác là một số tiếng Tai trong lãnh thổ Việt nam lại vay mượn từ tiếng Việt, một khả năng thường không được các học giả trong ngành văn học về ngôn ngữ học lịch sử Đông Nam Á thảo luận tới. Trong tình hình như vậy, các dữ liệu về tiếng Tai vay mượn từ tiếng Việt có thể tạo ra một cảm tưởng sai lầm về từ tiếng Tai mượn từ tiếng Việt. Cuối cùng, sự thiếu vắng vốn từ vựng cơ bản chung, như đại từ, số từ, từ chỉ các bộ phận của cơ thể, hay các danh từ và động từ cơ bản khác khá có sức thuyết phục trong việc không xếp tiếng Việt vào hệ ngôn ngữ Tai-Kadai.
Điều đó không có nghĩa là tiếng Việt không giao tiếp với các ngôn ngữ Tai. Một danh mục từ mới được Nguyễn Tài Cẩn[12] tổng hợp. Ông đã sưu tầm được gần hai chục từ có thể được tiếng Việt vay mượn từ tiếng Tai. Việc so sánh các từ này với các phục nguyên từ Tai nguyên thuỷ(17) cho thấy rằng đúng là có một số hình thái có thể là các ứng cử viên nặng ký của các từ vay mượn. Phương pháp tiếp cận tốt nhất có thể là so sánh các hình thái được phục nguyên với những từ này của tiếng Việt với các hình thái tiếng Tai nguyên thuỷ được phục nguyên. Nếu không, các mô hình về sự biến đổi âm không thể đánh giá chính xác được, và vì thế khó tránh các giả thiết sai lầm. Một công trình như vậy đang chờ đợi sự phục nguyên hoàn chỉnh nhóm ngôn ngữ Vietic nguyên thuỷ (tức là nhóm ngôn ngữ bao gồm tiếng Việt, tiếng Mường và khoảng hai chục ngôn ngữ Chứt)(18). Rất nhiều từ vay mượn từ tiếng Tai sang tiếng Việt liên quan đến nông nghiệp (ví dụ: vịt [duck] và đực [male animal]), một tình huống gợi ý về một mối giao lưu ngôn ngữ nhưng không phải là mối giao lưu có ảnh hưởng đáng kể tới tiếng Việt.
Sự giống nhau về hệ thống phân loại giữa tiếng Việt và tiếng Tai, nhất là về thanh điệu, đã được các học giả theo trường phái này cho là biểu hiện của cùng nguồn gốc, hay có thể là kết quả của những giao tiếp lâu dài mà tiếng Việt đã phát triển một số đặc tính của tiếng Tai, nhưng khu vực địa lý của những ngôn ngữ có thanh điệu và biệt lập/đơn âm ở khắp Trung Quốc và lục địa Đông Nam Á rộng lớn tới mức không thể chỉ sử dụng sự có mặt của thanh điệu (mà không dùng các yếu tố khác, nhất là sự tương thích về âm vị) là căn cứ chứng minh nguồn gốc ngôn ngữ. Quả vậy, ngay cả một số ngôn ngữ Môn-Khme và ngôn ngữ Chàm ở vùng Nam Đảo cũng có xu hướng đơn âm và phát triển thanh điệu(19). Việc sử dụng đặc tính hệ thống phân loại theo vùng này để củng cố các lập lụân về nguồn gốc ngôn ngữ tốt nhất cũng rất rủi ro. Dựa trên cơ sở của sự gần gũi về địa lý giữa tiếng Việt và nhóm tiếng Tai và trên cơ sở một số bằng chứng về từ vựng nói trên, có thể nói một cách tương đối chắc chắn rằng hai nghìn năm trước tổ tiên người Việt đã giao lưu với người Tai ở khu vực Nam Trung Quốc và Bắc Việt Nam hiện nay. Phạm Đức Dương đã thảo luận về điều có vẻ là cơ sở ngôn ngữ học – các bằng chứng về từ vựng nói trên – để chứng minh cho sự vay mượn của nền văn hoá lúa nước giữa người Việt và người Tai[20]. Bằng chứng về gien sinh học cũng gợi ra những liên kết chặt chẽ có thể có giữa các nhóm người Việt với người Tai, song các công trình nghiên cứu khác lại chỉ ra các quan hệ giữa các nhóm người Môn-Khme với người Tai-Kadai[21]. Tuy nhiên, nhìn chung, dựa trên các dữ liệu hiện tại và các phương pháp nghiên cứu, nhiều nhất thì mối quan hệ Việt – Tai chỉ có thể được xem là một trong các giao lưu ngôn ngữ vừa phải.
5. Các nguồn gốc Thái Bình Dương: Nhóm Nam Đảo và tiếng Nhật
Cũng tồn tại một nhóm học thuyết liên quan và trùng lặp khác, tất cả đều gợi ý về nguồn gốc Thái Bình Dương của tiếng Việt, kể cả những lập luận về nguồn gốc chung với họ ngôn ngữ vùng Nam Đảo và tiếng Nhật. Keith Taylor, trong phần mở đầu cuốn sách Sự ra đời của Việt Nam của mình, đã viết nhận xét dưới đây, dựa trên cơ sở những phân tích của ông về truyền thống văn hoá và dân gian: ”Những truyền thông huyền thoại về Lạc Long Quân và nguồn gốc của các Vua Hùng cho thấy một nền văn hoá hướng về biển để thích nghi với môi trường lục địa. Nền văn minh đã xuất hiện cùng với một anh hùng văn hoá tới từ vùng biển đã đánh bại quyền lực lục địa bằng cách bắt giữ vợ của kẻ thù của mình và biến người phụ nữ đó thành mẹ của những đứa con thừa tự của mình. Nguồn gốc huyền thoại của các Vua Hùng phản ánh một nền văn hoá biển dựa trên sự lớn dần về chính trị từ các ảnh hưởng của lục địa”[22].
Những người khác đã đưa ra bằng chứng về từ vựng để hỗ trợ cho một khái niệm như vậy. Những công trình nghiên cứu ban đầu để chứng minh cho mối quan hệ giữa tiếng Việt với ngôn ngữ vùng Nam Đảo là của Nobuhiro Matsumoto, Bình Nguyên Lộc và Nguyễn Ngọc Bích[23-25]. Matsumoto là người đi xa nhất, gợi ra mối quan hệ giữa tiếng Việt và cả tiếng Nhật lẫn tiếng Malai-Pô-lê-ni-zian. Ông đã đưa ra hơn bảy mươi từ gốc có khả năng liên quan giữa tiếng Việt và tiếng Nhật, nhưng chỉ có 9 hình thái để bảo vệ cho quan điểm về mối liên kết giữa tiếng Việt và tiếng vùng Nam Đảo(20)
Bằng chứng này bao gồm một số từ vựng có vẻ là cơ bản nhưng không có các hình thái cơ bản hệ thống nào, và không có số đếm, đại từ, từ mô tả các bộ phận cơ thể hay các từ vựng thực sự là cơ bản khác. Một vấn đề khác rất dễ nhận thấy đối với danh mục các từ này là thiếu những tương ứng âm vị, nhất là về khía cạnh thanh điệu và không có sự giải thích hợp lý nào được đưa ra.
Xem xét các dữ liệu từ vựng ở Bảng số 2, lấy từ tài liệu của tác giả Bình Nguyên Lộc[24], “Cằm” là một từ mô tả bộ phận của cơ thể, nhưng về mặt ngữ nghĩa không phải là một bộ phận cơ bản của cơ thể, như từ “mặt” hay “cánh tay”, và cũng thiếu các từ mô tả các bộ phận cơ thể khác. Từ tiếng Việt bạn [friend] là một từ vay mượn tiêu biểu giữa tiếng Hán và tiếng Việt (từ [companion] trong tiếng Hán). Các dạng tương tự về ngữ âm của từ “mật ong” được thấy trong nhiều ngôn ngữ ở khu vực, kể cả tiếng Môn-Khme và tiếng Hán, và không thể dùng để chứng minh cho lập luận về nguồn gốc lịch sử chung hay thậm chí là vay mượn. “Đảo” rõ ràng là một từ mượn từ tiếng Chàm vì nó là một trong số ít từ có hai âm tiết trong tiếng Việt (tức là hai âm tiết không có nghĩa riêng lẻ và đó cũng không phải là một từ láy âm). “Lá” rất có thể là từ Môn-Khme; đây có thể là hình thái Chàm, song có vẻ dễ gây nhầm lẫn(21). Việc loại trừ các ví dụ này làm cho các từ “cây” và “núi” có vẻ là những trường hợp tương tự tình cờ(22). Một vấn đề khác là các hạng mục từ vựng trong tiếng Ma-lay và tiếng Chàm không nhất quán, trong khi xem xét sự gần nhau tương đối về ngôn ngữ học giữa hai ngôn ngữ này (cả hai ngôn ngữ đều là những phần gắn bó chặt chẽ của tiểu nhánh Ma-lai của ngôn ngữ vùng Nam Đảo), cần phải có thêm nhiều trường hợp nữa. Tiếp theo, như trong trường hợp từ “cây” và “đảo”, khi xem xét về chiều sâu đáng kể của thời gian (hơn hai ngàn năm), những tương ứng về âm thực sự ít rõ ràng hơn, mặc dù vẫn tồn tại các hình mẫu có thể giải thích được và có hệ thống về sự biến đổi ngữ âm. Vì vậy, trong trường hợp nhiều nhất thì bằng chứng này cũng đáng nghi ngờ, và những gì chúng ta có được rất có thể là một tập hợp các từ cùng gốc giả. Cuối cùng, khi xem xét cùng với nhau, những điều này không phải là một tập hợp các từ nguyên tiêu biểu của vùng Nam Đảo, có thể có sức thuyết phục để chứng minh cho lập luận về nguồn gốc ngôn ngữ.
Theo một phương pháp tiếp cận khác, theo giả thiết về nhóm ngôn ngữ liên họ ở vùng Đông Nam Á, Thái Bình Dương và Tiểu lục địa Ấn Độ, thì tiếng Việt có thể được xem là gắn với hệ ngôn ngữ vùng Nam Đảo[26]. Bằng chứng rõ ràng nhất về sự gắn bó giữa họ ngôn ngữ vùng Nam Đảo với hệ Nam Á là hình thái ngôn ngữ[27] và bằng chứng về từ vựng thì cực kỳ hiếm[28]. Tiếng Việt chỉ cho thấy các mô hình về hình thái và cấu trúc từ chung, như ta thấy trong các ngôn ngữ thuộc tiểu nhánh Vietic rất gần gũi. Các mô hình này chỉ ra những dấu vết còn lại của tiếp đầu ngữ /pa-/ của động từ, một tiếp đầu ngữ phổ biến trong nhiều ngôn ngữ vùng Nam Đảo và Môn-Khme. Bằng chứng về từ vựng cũng rất hiếm hoi, chỉ có vài khả năng là các từ “chó”, “mắt”, “cá” và vài từ khác nữa. Ngay dù giả thiết này đứng vững được, thì quan hệ trực tiếp nhất vẫn là giữ tiếng Việt với tiếng Môn-Khme, chứ không phải là với ngôn ngữ vùng Nam Đảo.
Khi xem xét vị trí địa lý của ngôn ngữ Việt, thì quan điểm cho rằng tiếng Việt có nguồn gốc từ vùng đáo Thái Bình Dương có thể đúng. Bờ biển phía Bắc Việt Nam có thể được những người du hành từ vùng Nam Đảo tiếp cận, và theo các học thuyết hiện tại[29] thì những người này đi từ Nam Trung Quốc sang Đài Loan và tiến xuống phía Nam, tới tận Phi-lippin và quần đảo In-đô-nê-xia. Rõ ràng người Chàm là tổ tiên của làn sóng di cư vĩ đại này. Họ đã tới bờ biển phía nam Việt Nam khoảng hai ngàn năm trước và người Việt là láng giềng liền kề của họ ở phía Bắc Đế chế Chăm-pa cho đến khi Đế chế này rơi vào tay người Việt hồi thế kỷ 15. Có thể đã có giao tiếp về ngôn ngữ giữa người Việt và người Chàm, nhưng người Việt đã có mối quan hệ chính trị không thân thiện với những người láng giềng của mình ở phía Nam. Theo các dữ liệu về ngôn ngữ học, sự giao tiếp giữa họ rất ít; chỉ có vài ví dụ về các từ vay mượn từ tiếng Chàm hay ngôn ngữ vùng Nam Đảo được đưa ra một cách chắc chắn(23). Sự thiếu vắng một cơ sở chắc chắn về từ vựng cơ bản và các mô hình về sự tương ứng âm vị làm cho lập luận rằng tiếng Việt có nguồn gốc từ họ ngôn ngữ vùng Nam Đảo trở nên rất bấp bênh.

•Chú thích:

(16) Maspéro, “Études sur la Phonétique Historique de la Langue Annamite: Les Initiales.” Một công trình nghiên cứu ít được trích dẫn hơn chứa đựng điều mà tác giả coi là các từ cùng gốc giữa tiếng Việt và một vài tiếng Tai khác.
(17) Những từ vay mượn từ ngôn ngữ Tai trong tiếng Việt do Nguyễn Tài Cẩn đưa ra được so sánh với “Proto – Tai – O-Matric” trực tuyến, một cơ sở dữ liệu các từ proto-Tai được tái hiện .
(18) Như đã được thảo luận bởi Nguyễn Tài Cẩn trong Giáo trình lịch sử ngữ âm tiếng Việt
(19) Để xem các ý kiến thảo luận tương tự.
(20) Khối lượng lớn các từ cùng gốc Nhật – Việt này được một người sử dụng tiếng Nhật đưa ra có thể là một dấu hiệu của khả năng sáng tạo để các nhà ngôn ngữ học nhận ra những mô hình trong các ngôn ngữ mà họ hiểu biết sâu sắc nhất, chứ không phải là dấu hiệu của các kiến thức có ý nghĩa. Khả năng tìm ra các từ có âm tương tự chắc chắn được củng cố khi số các âm vị có thể tìm thấy ít hơn, như trong trường hợp tiếng Nhật, một ngôn ngữ chỉ có năm nguyên âm, ngược với tiếng Việt có tới mười tám nguyên âm, tuỳ thuộc vào sự biến thể giữa các vùng.
(21) Về giả thiết mà nói thì từ Chàm có thể là từ vay mượn từ Môn-Khme, khi người Chàm có giao tiếp sâu rộng với người Môn-Khme ở vùng Trung bộ Việt Nam trong vài thế kỷ qua.
(22) Một khía cạnh nữa cần xem xét là âm tiết nào trong một từ hai âm tiết bị mất đi. Ví dụ trong các ngôn ngữ Môn-Khme và Chàm, trọng âm trong các từ hai âm tiết rơi vào âm tiết thứ hai, do đó làm cho âm tiết đầu chứ không phải là âm tiết cuối cùng bị mất đi. Giả sử tiếng Việt theo mô hình này, như bằng chứng ngôn ngữ học lịch sử chỉ ra, thì những từ như cây sẽ không giữ được âm tiết đầu tiên
(23) Đã thảo luận ba chục từ gốc vùng Nam Đảo trong tiếng Việt, song phần lớn các từ này phải bị loại bỏ vì nhiều trong số từ đó bắt nguồn từ nhiều nhóm ngôn ngữ hoặc hầu hết số từ đó đều có vấn đề về âm vị khi tái hiện.