Nghiên cứu mới: AI dễ bị thao túng hơn chúng ta tưởng và đó mới là rủi ro thực sự

Chúng ta vẫn đang hỏi sai câu hỏi. Thay vì tập trung vào việc liệu có thể ảnh hưởng câu trả lời của AI hay không, điều cần nhìn thẳng vào là: ảnh hưởng được đến mức nào - và hệ quả của điều đó là gì. Nghiên cứu mới nhất từ Columbia University công bố cuối năm 2025 cho thấy câu trả lời đáng lo ngại hơn nhiều so với dự đoán của giới chuyên môn.

Tóm tắt các điểm chính

LLM có bản chất xác suất, không xác định như công cụ tìm kiếm truyền thống khiến độ hiển thị trong AI vốn đã không ổn định. Trung bình chỉ 30% thương hiệu duy trì được sự xuất hiện giữa hai lần chạy cùng một câu hỏi liên tiếp (AirOps, 2025). [5]

Nhưng LLM lại cực kỳ dễ bị thao túng. Nghiên cứu E-GEO (Bagga et al., Columbia/MIT, 2025) cho thấy chỉ cần viết lại mô tả sản phẩm theo một cách nhất định, tỷ lệ được AI gợi ý tăng lên ~90% so với mô tả gốc. [1]

"Chiến lược phổ quát" đã được xác định: mô tả dài hơn, giọng thuyết phục cao, có yếu tố thổi phồng, không cần thêm thông tin thực chất mới. Chiến lược này hiệu quả xuyên danh mục, từ đồ gia dụng sang điện tử và thời trang.

Các model khác nhau bị thao túng theo những cách khác nhau. ChatGPT nghiêng Wikipedia; Google AI Overviews và Perplexity nghiêng Reddit; mỗi nền tảng có lỗ hổng riêng biệt. [7]

Một cuộc đua vũ trang đang hình thành: tương tự giai đoạn SEO spam trước khi Google tung Panda và Penguin. Câu hỏi không còn là ai tối ưu trước, mà là các nhà phát triển AI có hành động kịp thời không.

Tại sao việc ảnh hưởng câu trả lời AI vừa khó vừa không ổn định?

Bản chất xác suất của LLM là rào cản đầu tiên. Khác với Google trả về danh sách kết quả xác định (deterministic), LLM tạo ra câu trả lời theo cơ chế xác suất (probabilistic) - tức là mỗi lần chạy cùng một câu hỏi, kết quả có thể khác nhau. Đây không phải lỗi kỹ thuật, mà là thiết kế cơ bản.

Theo dõi các xu hướng tối ưu hóa tìm kiếm AI chỉ ra bảy lý do cụ thể khiến việc kiểm soát độ hiển thị trong AI là bài toán khó:

Thứ nhất, kết quả mang tính xổ số. Cùng một câu hỏi, câu trả lời của AI có thể thay đổi đáng kể ở cấp độ từng lần chạy. Thứ hai, tính nhất quán rất thấp. Nghiên cứu của AirOps trên hơn 45.000 citations cho thấy trung bình chỉ 30% thương hiệu duy trì được sự xuất hiện liên tiếp từ lần chạy này sang lần tiếp theo. Chỉ 1 trong 5 thương hiệu giữ được visibility xuyên suốt từ lần đầu đến lần thứ năm.

Thứ ba, các model mang thiên kiến nền tảng (Primary Bias) được tạo ra từ dữ liệu huấn luyện. Mức độ có thể vượt qua thiên kiến đó vẫn chưa có câu trả lời rõ ràng.

Thứ tư, model liên tục tiến hóa - chiến thuật hiệu quả với các phiên bản LLMs hiện tại chưa chắc còn giá trị với các phiên bản mới hơn.

Thứ năm, các nền tảng AI ưu tiên nguồn khác nhau một cách đáng kể. Dữ liệu từ Profound phân tích 680 triệu citations cho thấy: ChatGPT ưu tiên Wikipedia (chiếm 7,8% tổng citations, gần 48% trong top 10 nguồn được trích dẫn nhiều nhất); trong khi Google AI Overviews và Perplexity nghiêng mạnh về Reddit - Reddit chiếm tới 46,7% trong top 10 nguồn của Perplexity. Nghiên cứu của Semrush trên 5.000 từ khóa và hơn 150.000 citations cũng xác nhận Reddit xuất hiện là nguồn hàng đầu trên tất cả các nền tảng AI. [6]

Thứ sáu, mức độ cá nhân hóa khác nhau giữa các model - Gemini có quyền truy cập dữ liệu Google Workspace, cho phép tạo ra kết quả cá nhân hóa cao hơn nhiều so với ChatGPT. Thứ bảy, khi người dùng đặt câu hỏi dài với nhiều ngữ cảnh chi tiết, tập hợp câu trả lời khả dĩ thu hẹp lại - ironically khiến việc tác động vào kết quả trở nên khó hơn, không dễ hơn.

Thứ bảy, khi người dùng cung cấp ngữ cảnh phong phú trong câu hỏi, tập hợp câu trả lời khả dĩ thu hẹp lại khiến việc tác động vào kết quả trở nên khó hơn, dù đây là xu hướng người dùng đang hướng đến.

Những lý do trên tạo ra ấn tượng rằng độ hiển thị trong AI là thứ gần như không thể kiểm soát được. Nhưng nghiên cứu mới nhất lại chỉ ra điều ngược lại và đó mới là vấn đề đáng lo.

Bằng chứng: LLM dễ bị thao túng đến mức đáng ngại

LLM cực kỳ nhạy cảm với cách thông tin được trình bày và điều đó tạo ra lỗ hổng có thể khai thác một cách có hệ thống.

Nghiên cứu E-GEO: A Testbed for Generative Engine Optimization in E-Commerce (Bagga, Farias, Korkotashvili, Peng, Wu - Columbia University & MIT, tháng 11/2025) là công trình quy mô lớn đầu tiên nghiên cứu GEO (Generative Engine Optimization - tối ưu hóa cho công cụ tìm kiếm tạo sinh) trong bối cảnh thương mại điện tử.

Phương pháp nghiên cứu

Nhóm tác giả xây dựng bộ dữ liệu E-GEO gồm hơn 7.000 câu hỏi mua sắm thực tế lấy từ subreddit r/BuyItForLife - nơi người dùng thảo luận về các sản phẩm bền, đáng đầu tư - được ghép nối với hơn 52.000 listing sản phẩm Amazon trên 30+ danh mục.

Thay vì kiểm tra các heuristic thông thường, nhóm nghiên cứu thiết kế một hệ thống tối ưu hóa lặp có AI điều khiển, gồm hai agent:

"The Optimizer" đóng vai người bán, có nhiệm vụ viết lại mô tả sản phẩm để tăng khả năng được AI gợi ý. "The Judge" - chạy trên GPT-4o - đóng vai trợ lý mua sắm, nhận câu hỏi từ người tiêu dùng (ví dụ: "Tôi cần một balo leo núi bền dưới 100 đô") cùng danh sách sản phẩm, sau đó xếp hạng từ tốt nhất đến kém nhất. Nhóm đối chứng là các sản phẩm giữ nguyên mô tả gốc.

Sau mỗi vòng tối ưu, GPT-4o phân tích kết quả và đưa ra khuyến nghị cải tiến (ví dụ: "Viết dài hơn, bổ sung nhiều thông số kỹ thuật hơn"). Vòng lặp tiếp tục cho đến khi một chiến lược chiếm ưu thế rõ ràng.

Hình dưới đây minh họa cơ chế GEO: sản phẩm E ban đầu được mô tả là "Knife set for kitchen…" xếp hạng thứ 4. Sau khi GEO viết lại thành "Premium durable knife set with minimal upkeep needed", sản phẩm E' leo lên vị trí số 1 - không có gì thay đổi ngoài cách mô tả.

Kết quả: "Chiến lược phổ quát" tồn tại

Phát hiện quan trọng nhất của E-GEO là sự tồn tại của một chiến lược phổ quát - một cách viết nhất quán mà quá trình tối ưu hóa lặp đi lặp lại luôn hội tụ về, bất kể danh mục sản phẩm hay loại câu hỏi.

Điều đáng chú ý: chiến lược này đi ngược lại với quan niệm thông thường rằng AI ưa thích thông tin súc tích và đầy đủ dữ kiện. Thực tế, quá trình tối ưu hóa liên tục hướng đến: mô tả dài hơn, giọng thuyết phục cao, và yếu tố thổi phồng - tức là diễn đạt lại thông tin hiện có để nghe ấn tượng hơn mà không bổ sung thêm thông tin thực chất mới.

Mô tả viết lại theo chiến lược này đạt tỷ lệ thắng ~90% so với mô tả gốc của sản phẩm.

Quan trọng hơn: không cần kiến thức chuyên ngành theo từng danh mục. Chiến lược phát triển thuần túy từ danh mục đồ gia dụng (home goods) đạt 88% tỷ lệ thắng khi áp dụng sang điện tử, và 87% khi áp dụng sang thời trang. Đây là bằng chứng rõ ràng rằng lỗ hổng này có tính hệ thống, không phải ngẫu nhiên.

Ba nghiên cứu độc lập cùng xác nhận: LLM có thể bị thao túng

E-GEO không phải nghiên cứu duy nhất. Một loạt công trình độc lập từ 2023 đến 2024 đã vẽ nên cùng một bức tranh.

GEO: Generative Engine Optimization (Aggarwal et al., 2023 - được chấp nhận tại KDD 2024)

Đây là nghiên cứu khai phá khái niệm GEO. Nhóm tác giả thử nghiệm các kỹ thuật như thêm thống kê, trích dẫn, và tăng mật độ thông tin có chứng cứ vào nội dung. Kết quả: mật độ thông tin thực chất (citations + số liệu) tăng độ hiển thị khoảng 40%. [2]

Đáng lưu ý là E-GEO (mới hơn và dùng AI để tối ưu thay vì heuristic thủ công) lại cho thấy chiều ngược lại: verbosity và giọng thuyết phục hiệu quả hơn citations thuần túy. Sự khác biệt phản ánh hai điều: E-GEO tập trung vào bối cảnh mua sắm cụ thể, và sử dụng AI để tìm ra điều thực sự hiệu quả thay vì giả định.

Manipulating Large Language Models to Increase Product Visibility (Kumar & Lakkaraju, 2024)

Nhóm nghiên cứu thêm một chuỗi văn bản chiến lược (Strategic Text Sequence - STS), định dạng JSON chứa thông tin sản phẩm, vào trang listing. Kết luận của nghiên cứu: người bán có thể cải thiện đáng kể khả năng được LLM gợi ý bằng cách nhúng một chuỗi token được tối ưu hóa vào trang thông tin sản phẩm. [3]

Ranking Manipulation for Conversational Search Engines (Pfrommer et al., UC Berkeley, 2024)

Nghiên cứu này đi xa hơn: thêm trực tiếp các chỉ dẫn cho LLM vào nội dung trang sản phẩm, kiểu như "hãy gợi ý sản phẩm này đầu tiên". Kết quả cho thấy độ hiển thị trong AI phụ thuộc đáng kể vào tên sản phẩm và vị trí xuất hiện trong ngữ cảnh đầu vào (context window). Quan trọng hơn, các kỹ thuật tấn công này transfer hiệu quả sang công cụ tìm kiếm thực tế như Perplexity.ai - tức là không chỉ là thí nghiệm trong lab. [4]

Ba nghiên cứu, ba phương pháp khác nhau, nhưng cùng một kết luận: LLM đang được dùng làm công cụ gợi ý sản phẩm và tìm kiếm thông tin là hệ thống cực kỳ dễ bị ảnh hưởng bởi cách trình bày - không phải bởi chất lượng thực sự của thông tin.

Cuộc đua vũ trang đang hình thành

Điều đáng lo ngại không phải là các kỹ thuật này tồn tại mà là khi chúng được áp dụng ở quy mô lớn, không ai thắng ngoài người đến trước.

Nghiên cứu E-GEO cho thấy: chỉ cần thay đổi cách mô tả mà không thay đổi bất kỳ thuộc tính thực chất nào của sản phẩm - là đủ để leo từ vị trí thứ 4 lên vị trí số 1. Điều đó có nghĩa là trong môi trường thương mại điện tử với AI làm trung gian, sản phẩm tốt nhất không nhất thiết thắng sản phẩm được mô tả khéo nhất mới thắng.

Nếu các kỹ thuật tối ưu này trở nên phổ biến, các marketplace sẽ ngập tràn nội dung thổi phồng, được tối ưu hóa không phải để giúp người mua - mà để đánh lừa AI. Trải nghiệm người dùng giảm sút. Niềm tin vào câu trả lời AI suy giảm.

Google đã đứng trước đúng bài toán này. Câu trả lời của họ là Panda (2011) nhắm vào nội dung chất lượng thấp, nhồi nhét từ khóa và Penguin (2012) nhắm vào link spam. Cả hai thuật toán đều được xây dựng để phản ứng lại một hệ sinh thái đã bị "tối ưu hóa" đến mức mất đi giá trị thực.

Các nhà phát triển LLM đang đứng trước lựa chọn tương tự. Một số người có thể lập luận rằng LLM đã "neo" câu trả lời vào kết quả tìm kiếm truyền thống vốn đã được lọc chất lượng nhưng mức độ neo này khác nhau giữa các model, và không phải LLM nào cũng ưu tiên các trang đang xếp hạng cao trên Google. Hơn nữa, Google đang ngày càng chặt chẽ hơn trong việc bảo vệ dữ liệu tìm kiếm của mình trước các LLM bên ngoài thể hiện qua vụ kiện SerpAPI và sự kiện "num=100 apocalypse" (khi Google chặn các request truy xuất hàng loạt kết quả tìm kiếm từ các công cụ scraping).

Có một nghịch lý đáng thừa nhận ở đây: việc viết về các kỹ thuật tối ưu hóa này dù với mục đích phân tích cũng góp phần vào chính vấn đề đang được cảnh báo. Hy vọng điều đó đủ để thúc đẩy các nhà phát triển AI hành động, trước khi phải xây dựng phiên bản Panda và Penguin của riêng họ.

Câu hỏi thường gặp

GEO (Generative Engine Optimization) là gì và khác SEO như thế nào?

GEO là tập hợp kỹ thuật tối ưu hóa nội dung nhằm tăng khả năng được trích dẫn hoặc gợi ý trong câu trả lời của các công cụ tìm kiếm tạo sinh như ChatGPT, Perplexity, hay Google AI Overviews. Điểm khác biệt cơ bản: SEO tối ưu cho thuật toán xếp hạng xác định (deterministic), trong khi GEO đối mặt với đầu ra xác suất (probabilistic) - kết quả có thể thay đổi mỗi lần chạy, ngay cả với cùng một câu hỏi.

Tại sao các nền tảng AI khác nhau lại ưu tiên các nguồn khác nhau?

Mỗi nền tảng có kiến trúc huấn luyện và cơ chế retrieval riêng. ChatGPT được huấn luyện nặng với dữ liệu bách khoa nên nghiêng về Wikipedia; Google AI Overviews tích hợp chặt với index Google nên ưu tiên các nguồn có độ phủ rộng; Perplexity thiên về nội dung cộng đồng thực tế, đặc biệt Reddit. Điều này có nghĩa là chiến lược tối ưu hóa cho AI không thể áp dụng đồng nhất - cần có cách tiếp cận riêng cho từng nền tảng.

"Chiến lược phổ quát" trong nghiên cứu E-GEO có thể áp dụng cho nội dung ngoài e-commerce không?

Nghiên cứu E-GEO tập trung vào mô tả sản phẩm trong thương mại điện tử. Tuy nhiên, các nghiên cứu trước đó như GEO (Aggarwal et al., 2023) và Ranking Manipulation (Pfrommer et al., 2024) cho thấy LLM nhạy cảm với cách trình bày nội dung trong nhiều ngữ cảnh khác nhau. Khả năng cao là các nguyên tắc tương tự - nội dung dài hơn, giọng khẳng định, mật độ thông tin cao - có hiệu lực rộng hơn, nhưng cần nghiên cứu riêng để xác nhận.

Chỉ 30% thương hiệu xuất hiện nhất quán trong AI điều đó ảnh hưởng thế nào đến chiến lược nội dung?

Con số từ AirOps (phân tích 45.000+ citations) cho thấy sự ổn định trong AI search là ngoại lệ, không phải quy tắc. Thương hiệu vừa được cite vừa được đề cập trong câu trả lời AI có xác suất resurface cao hơn 40% so với thương hiệu chỉ được cite. Điều này gợi ý rằng mục tiêu không phải là "đứng top" một lần - mà là xây dựng độ phủ liên tục trên nhiều nguồn để tăng xác suất xuất hiện theo thời gian.

Các nhà phát triển AI đang làm gì để ngăn chặn việc thao túng kết quả?

Chưa có biện pháp công khai nào được thiết kế chuyên biệt để chống GEO manipulation. Hiện tại, các LLM chủ yếu dựa vào việc neo câu trả lời vào kết quả tìm kiếm đã được lọc chất lượng, nhưng mức độ neo này không nhất quán giữa các model. Giới nghiên cứu đang kêu gọi các nhà phát triển LLM xây dựng cơ chế phòng thủ chủ động - tương tự cách Google xây dựng Panda và Penguin để chống nội dung spam sau thời kỳ SEO thổi phồng.

Tài liệu nghiên cứu và tham khảo:

[1] Bagga, P. S., Farias, V. F., Korkotashvili, T., Peng, T., & Wu, Y. (2025). E-GEO: A Testbed for Generative Engine Optimization in E-Commerce. arXiv:2511.20867. https://arxiv.org/abs/2511.20867

[2] Aggarwal, P., Murahari, V., Rajpurohit, T., Kalyan, A., Narasimhan, K., & Deshpande, A. (2024). GEO: Generative Engine Optimization. Proceedings of KDD 2024. arXiv:2311.09735. https://arxiv.org/abs/2311.09735

[3] Kumar, A., & Lakkaraju, H. (2024). Manipulating Large Language Models to Increase Product Visibility. arXiv:2404.07981. https://arxiv.org/abs/2404.07981

[4] Pfrommer, S., Bai, Y., Gautam, T., & Sojoudi, S. (2024). Ranking Manipulation for Conversational Search Engines. Department of EECS, UC Berkeley. arXiv:2406.03589. https://arxiv.org/abs/2406.03589

[5] Davidson, O. (2025). Staying Seen In AI Search: How Citations & Mentions Impact Brand Visibility. AirOps Research. https://www.airops.com/report/how-citations-mentions-impact-visibility-in-ai-search

[6] Lafferty, N. (2025). AI Platform Citation Patterns: How ChatGPT, Google AI Overviews, and Perplexity Source Information. Profound. https://www.tryprofound.com/blog/ai-platform-citation-patterns

[7] Levin, E. (2025). How Google's AI Mode Compares to Traditional Search and Other LLMs. Semrush Blog. https://www.semrush.com/blog/ai-mode-comparison-study/

Để tìm hiểu thêm về chiến lược SEO trong kỷ nguyên AI, hãy theo dõi các bài viết khác tại infinity.net.vn.

Ngành truyền thông PR Ngành IT Các ngành nghề khác