Cách rõ ràng nhất để nhận biết ai đó đang (lén lút) viết bài bằng A.I

Tôi lướt mạng đủ nhiều để nhận ra dạo này người ta rất tự tin vào khả năng "nhìn phát biết ngay" bài nào do A.I viết. Điều này chắc cũng giải thích tại sao cứ vài ngày lại có người đăng một bài "bóc phốt".

Người thì soi từng dấu câu. Người khác lại nghi ngờ những bài viết có cấu trúc quá hoàn hảo. Dạo gần đây, tôi còn thấy nhiều người coi những thủ pháp văn học hết sức bình thường là bằng chứng tố cáo ai đó đã lén mở ChatGPT giữa chừng.

Sáng nay, vì tò mò nên tôi có đọc một bài viết kiểu vậy. Các ví dụ đưa ra rất khiên cưỡng. Một đoạn thì chỉ điểm phép so sánh là dấu hiệu hiển nhiên của A.I. Đoạn khác lại cảnh báo người đọc hãy cẩn thận với các phép ẩn dụ. Nếu đây là sự thật, nó hẳn là một cú sốc với gần như mọi tiểu thuyết gia, nhà văn viết tiểu luận hay người phụ trách chuyên mục trong suốt cả trăm năm qua.

Sau đó, mọi thứ còn trở nên nực cười hơn.

Tác giả đó bắt đầu mổ xẻ các cụm từ như "hơi khó hiểu" hay "cực kỳ khó khăn", cứ làm như thể các từ bổ nghĩa mới được các kỹ sư tại Thung lũng Silicon phát minh ra vào khoảng năm 2023 vậy. Còn có các ví dụ khác lôi cả nhịp điệu câu, từ ngữ chuyển ý và văn phong trò chuyện vào - những thứ mà các nhà văn đã chủ ý mài giũa suốt hàng thập kỷ.

Đó là lúc tôi bắt đầu để tâm xem người ta thực sự có ý gì khi khẳng định họ "luôn nhìn ra" bài nào được viết bằng A.I.

Nhiều cuộc tranh luận dường như mặc định rằng: những thói quen viết lách tốt bỗng nhiên trở nên đáng ngờ ngay từ khoảnh khắc ChatGPT xuất hiện. Cứ như thể phép ẩn dụ, cấu trúc trau chuốt hay nhịp điệu mượt mà giờ đây là "dấu vân tay" của trí tuệ nhân tạo. Nhưng hầu hết các ví dụ mà người ta đang ám ảnh thực chất chỉ là những công cụ viết tiêu chuẩn. Chúng đã tồn tại từ rất lâu, trước cả khi các mô hình ngôn ngữ lớn xuất hiện và đi sao chép những khuôn mẫu mà con người đã dành hàng thế kỷ để tinh chỉnh.

Hầu hết mọi người chẳng bao giờ dừng lại để suy nghĩ về điều đó. Họ chỉ chăm chăm vào lời buộc tội.

"Thước đo của một trí tuệ siêu việt là khả năng giữ hai ý tưởng trái ngược nhau trong đầu cùng một lúc mà vẫn duy trì được khả năng tư duy", F. Scott Fitzgerald đã viết như vậy trong cuốn The Crack-Up vào năm 1936. Nếu áp theo tiêu chuẩn mạng xã hội hiện nay, câu văn này có lẽ sẽ nhận về ba bình luận trên Reddit chê rằng nó nghe "hơi sặc mùi ChatGPT".

Càng xem nhiều ví dụ, tôi càng thấy toàn bộ câu chuyện này trở nên kỳ quặc. Các hệ thống A.I hiện đại được đào tạo trên một lượng khổng lồ các văn bản do con người viết, trích xuất từ tiểu thuyết, báo chí, tiểu luận, blog, kịch bản và các tài liệu học thuật - những thứ được viết từ rất lâu trước khi khái niệm "mô hình ngôn ngữ lớn" ra đời.

Để tôi nói cho bạn nghe điều này...

Nếu một người học được cách viết với nhịp điệu chắc tay hơn, cấu trúc gọn gàng hơn, hình ảnh sắc sảo hơn, hoặc chuyển ý mượt mà hơn, thì tự nhiên một phần bài viết của họ sẽ giống với chính những khuôn mẫu mà các mô hình A.I đã hấp thụ trong quá trình huấn luyện. Và theo thời gian, điều này tạo ra một nghịch lý: người ta bắt đầu nhầm lẫn các kỹ năng viết có tuổi đời hàng thế kỷ với bằng chứng cho thấy ai đó đã bí mật thuê chatbot viết bài.

Tôi đã làm công việc viết lách online toàn thời gian khoảng bảy năm nay, nghĩa là tôi có cảm nhận khá chuẩn xác về việc thế nào là tốc độ viết bền vững trong một khoảng thời gian dài. Vào một ngày sung sức, tôi thường có thể hoàn thành khoảng 2.000 từ mà não không có cảm giác bị "vắt kiệt". Nếu bạn xem lại các bài tôi viết từ năm 2019 trở đi, bạn sẽ thấy một tần suất gần như lặp đi lặp lại từ năm này qua năm khác. Sản lượng ổn định, lịch đăng bài đều đặn, và thỉnh thoảng sẽ có vài tuần năng suất giảm vì bận việc riêng.

Nhưng đây mới là lúc mọi thứ bắt đầu có mùi đáng ngờ...

Thỉnh thoảng, tôi lại thấy ai đó xuất bản tới năm bản tin (newsletter) mỗi ngày, mà bằng cách nào đó, bài nào cũng dài hơn 2.500 từ. Trong khi họ cũng đồng thời rêu rao rằng mình đang làm việc full-time trong ngành công nghệ ở Thung lũng Silicon, tập gym mỗi sáng, đi networking liên tục, du lịch hai lần một tháng, và vẫn có thời gian trả lời bình luận trên mạng cả ngày. Đến mức này, chúng ta không còn nói về việc người ấy đang có một ngày làm việc năng suất nữa. Thay vào đó, chúng ta đang nói về một khối lượng công việc vượt quá giới hạn chịu đựng về mặt thể chất mà một người bình thường có thể duy trì liên tục.

Điều này dẫn đến một số câu hỏi khá hiển nhiên.

Nicholas Carr từng viết trong cuốn The Shallows rằng: "dường như những gì internet đang làm là bào mòn khả năng tập trung và chiêm nghiệm của tôi". Trong khi đó, một số nhà sáng tạo nội dung online dường như lại đột nhiên sở hữu khả năng duy trì sản lượng hàng tuần ngang ngửa cả một đội ngũ biên tập nhỏ. Họ cân bằng được sự nghiệp bận rộn, vô số dự án phụ và các mối quan hệ xã hội mà không bao giờ bị chậm nhịp, tỏ ra kiệt sức về tinh thần hay có dấu hiệu tạm nghỉ đăng bài.

Thế là tôi bắt đầu nhẩm tính xem những lịch trình viết bài kiểu này thực tế sẽ đòi hỏi những gì.

Một nhà sáng tạo mà tôi từng theo dõi đã đăng tải gần 100.000 từ chỉ trong một tuần, trải dài trên các nền tảng từ newsletter, bài đăng LinkedIn, thread, cho đến các bài báo dài. Một người khác thậm chí còn làm gấp đôi số đó. Vậy thì hoặc là những người này đã tìm ra bí quyết loại bỏ hoàn toàn giấc ngủ ra khỏi cuộc sống, hoặc chắc chắn có A.I hỗ trợ.

Bạn hiểu ý tôi rồi đấy.

Hầu hết những người viết lách chuyên nghiệp mà tôi biết đều phải chật vật mới duy trì được việc xuất bản ba hoặc bốn bài viết chất lượng mỗi tuần, trong khi vẫn phải xoay xở với việc biên tập, nghiên cứu, trả lời email, làm việc hành chính, họp hành và thực hiện các trách nhiệm của một người trưởng thành. Có những ngày, mạch văn tuôn trào. Nhưng có những ngày khác, tôi phải dành cả tiếng đồng hồ chỉ để sửa đi sửa lại một đoạn văn tới sáu lần vì có một câu nghe hơi "cấn". Tôi từng có các bản nháp bị tắc tịt hoàn toàn vì những đoạn chuyển ý đọc không được xuôi tai, dù có gạch đi viết lại bao nhiêu lần đi chăng nữa.

Gần đây, một người bạn nhà văn của tôi có đi dự sự kiện của một tác giả viết sách lịch sử bán chạy - người đang được ca ngợi khắp nơi trên mạng. Tôi sẽ không nói đó là ai vì chuyện này không phải trọng tâm ở đây. Nhưng rõ ràng, nội dung cuốn sách cực kỳ thuyết phục. Nghiên cứu dày dạn, lập luận tự tin, dẫn chứng lịch sử cụ thể; những đoạn văn dài đọc lên nghe như được viết bởi một người đã dành nhiều năm để nghiên cứu bài bản về chủ đề này.

Sau đó, phần Hỏi & Đáp bắt đầu.

Một khán giả yêu cầu tác giả mở rộng thêm về một trong những lập luận trọng tâm của cuốn sách, và câu trả lời đưa ra lại mơ hồ một cách kỳ lạ. Một người khác đề cập đến một ví dụ cụ thể ở chương sáu, và câu trả lời “đi lòng vòng” hẳn ba mươi giây trước khi “hạ cánh” ở một nơi chẳng liên quan gì đến câu hỏi ban đầu. Đến lượt trao đổi thứ ba hay thứ tư, hình như những người trong khán phòng bắt đầu nhìn nhau, bởi vì người đang đứng trên bục kia dường như không còn sự kết nối nào với khối tài liệu đang nằm ngay trước mặt họ.

Đó là lúc tôi bắt đầu nghĩ rằng: một trong những bằng chứng rõ ràng nhất tố cáo việc dùng A.I có thể chẳng liên quan mấy đến bản thân bài viết. Theo lẽ thông thường, khi một người dành nhiều năm nghiên cứu một chủ đề, thông tin sẽ in sâu vào ngóc ngách trong não họ. Họ có thể vô tình nhớ lại những chi tiết cực kỳ nhỏ. Họ tự ngắt lời bản thân giữa chừng câu trả lời vì có một ví dụ khác đột nhiên nảy ra trong đầu. Đôi khi, họ còn giải thích tường tận những phần chẳng ai hỏi tới, đơn giản vì họ đã nhai đi nhai lại thông tin đó quá nhiều lần. Nhưng theo lời bạn tôi, cách vị tác giả trên trả lời những câu hỏi hệt như một người đang cố rặn nhớ lại ghi chú từ một bài thuyết trình mà họ chỉ kịp đọc lướt qua ở sảnh khách sạn hai mươi phút trước.

Cá nhân tôi nghĩ đó mới là điểm thú vị.

Bởi ngay lúc này, hàng ngàn người trên mạng vẫn đang dán mắt vào các cấu trúc và dấu câu để cố xác định xem một đoạn văn có "đậm chất A.I" hay không. Trong khi đó, một tác giả sách bán chạy có thể sản xuất ra vô vàn bài viết trau chuốt, nhưng lại lộ nguyên hình lúng túng ngay giây phút được yêu cầu họ giải thích lập luận của chính mình mà không có sự chuẩn bị trước.

Tôi cứ suy nghĩ về một thực tế: chúng ta đang tiêu tốn quá nhiều năng lượng để cố chế tạo ra những chiếc máy phát hiện nói dối cho việc viết lách, thay vì xây dựng những hệ thống vững chắc hơn để chứng minh sự uy tín.

Hiện tại, toàn bộ gánh nặng đang dồn lên vai độc giả. Họ phải tự tìm xem liệu ai đó có dùng A.I hay không sau khi nội dung đã lên sóng. Vì vậy, người ta bắt đầu soi mói các dấu câu, cấu trúc câu, thói quen diễn đạt và điểm số của các công cụ check A.I (những thứ vốn nổi tiếng là không đáng tin cậy), đơn giản vì đó là những bằng chứng duy nhất mà họ có. Và một khi sự nghi ngờ tích tụ đủ lớn, câu chuyện trên mạng có thể trở nên tồi tệ rất nhanh. Một vài lời buộc tội lan truyền. Đột nhiên, danh tiếng của một người viết bị đem ra mổ xẻ công khai bởi những người lạ - những người hoàn toàn không biết bài viết đó thực sự được tạo ra như thế nào.

Tôi nghĩ một phần vấn đề là internet thời hiện đại hầu như không còn cho độc giả cơ hội tiếp cận với "con người thật" đứng sau tác phẩm nữa. Đa số mọi người chỉ nhìn thấy bài viết sau khi nó đã được biên tập, gọt giũa, định dạng và đẩy qua ba ứng dụng khác nhau trước khi xuất bản. Con người thật đứng sau bài viết thường hoàn toàn vô hình, trừ khi họ chủ động tạo ra những không gian để tương tác trực tiếp với độc giả.

Đó là lý do tại sao tôi có một nhóm chat trên Substack, nơi tôi trả lời câu hỏi, nói về những cuốn sách mình đang đọc, thảo luận về ý tưởng bài viết, và thỉnh thoảng lảm nhảm về những thứ linh tinh. Các nhà văn khác thì livestream, làm podcast, gọi Zoom, hoặc tổ chức Hỏi & Đáp công khai để độc giả có thể đào sâu hơn vào các ý tưởng. Đó không phải là "nghi thức" màu mè để chứng minh tính xác thực. Đúng hơn, đó chỉ là sự nới rộng tự nhiên của việc: có một con người thật đang đứng sau tác phẩm.

Bởi vì sẽ có một hiệu ứng thú vị xảy ra khi các tác giả biết trước mình sẽ phải đối mặt với những cuộc trò chuyện trong đời thực...

Lúc này, việc xuất bản nội dung có sự hỗ trợ của A.I không còn là một quyết định biên tập cá nhân nữa, mà trở thành một rủi ro hiện hữu trước công chúng. Nếu ai đó tạo ra bài viết mà bản thân họ cũng chỉ hiểu lơ mơ, thì sớm muộn gì cũng sẽ có người yêu cầu họ giải thích sâu hơn về một quan điểm mà họ không thể làm rõ. Hoặc đặt câu hỏi về một số liệu thống kê mà họ chưa từng tự mình kiểm chứng. Hoặc chỉ ra một điểm mâu thuẫn bị chôn vùi ở giữa bài viết - thứ chỉ lộ diện khi cuộc trò chuyện bước ra khỏi những trang giấy.

Điều này làm thay đổi tâm lý về việc dùng A.I khá nhanh chóng.

Rất nhiều bài viết dùng A.I một cách lười biếng vẫn đang "sống khỏe" chính bởi internet hiện tại cho phép người ta xuất bản những nội dung có vẻ trau chuốt, mà không phải chịu trách nhiệm giải trình trước công chúng. Bài viết được đăng lên, lượt tương tác ập tới, và mọi người chuyển sang chủ đề tiếp theo. Nhưng một khi khán giả bắt đầu đòi hỏi sự tương tác sâu hơn giữa người viết và người đọc (vượt ra ngoài văn bản) thì một số động cơ sẽ tự nhiên thay đổi. Và thành thật mà nói, tôi nghĩ rất nhiều người đang lạm dụng A.I cũng đã hiểu rõ điều đó.

Bởi vì có sự khác biệt một trời một vực giữa việc: (1) tự động tạo ra một bài viết nghe có vẻ rất am hiểu, và (2) ngồi đối diện với một người khác trong khi họ dần nhận ra rằng... bạn hoàn toàn chẳng hiểu gì về chính lập luận của mình.

- Lược dịch từ bài viết “The Obvious Ways To Spot Someone Secretly Writing With AI” của tác giả Matt Lillywhite -