ChatGPT 101 – Tổng quan về trí tuệ nhân tạo đang thay đổi thế giới

Lưu ý quan trọng: Phần lớn kiến thức trong bài này dựa trên phân tích của Stephen Wolfram trong cuốn sách “What Is ChatGPT Doing … and Why Does It Work?” (1). Mình tin rằng để có thể khai thác tối đa tiềm năng của một công cụ, việc hiểu về nguyên tắc và cơ chế hoạt động nền tảng của mô hình là vô cùng cần thiết. Vậy nên, dù đường vào tim anh chatGPT lắm lối hơi rối, nhưng mình cùng nhau đi thử nhé.

Ở cuối bài sẽ có tài liệu để đọc thêm và một vài câu hỏi kiểm tra giúp bạn tương tác và ghi nhớ tốt hơn — hãy để lại câu trả lời ở phần bình luận nhé!

ChatGPT, được OpenAI phát triển và ra mắt từ năm 2021, hiện đang có hàng trăm triệu người dùng toàn cầu, đã và đang là một bước ngoặt trong cách chúng ta tương tác với AI, học tập và làm việc. Ban đầu, nó gây kinh ngạc vì khả năng hiểu và tạo ngôn ngữ tự nhiên như con người. Hiện tại, với sự xuất hiện của GPT‑5, ra mắt vào ngày 7/8/2025, ChatGPT đã được thiết kế để suy luận logic tự động và xử lý các nhiệm vụ phức tạp như một chuyên gia ở cấp độ tiến sĩ trong nhiều lĩnh vực, với tham vọng hướng đến trí tuệ nhân tạo tổng quan (AGI) - một hệ thống AI có thể thực hiện hầu hết các công việc như con người (2). Vậy tại sao ChatGPT có thể làm được điều này và nó có thực sự sẽ tạo ra môt siêu trí tuệ nhân tạo thay thế con người trong cả quy trình chứ không chỉ là tác vụ đơn lẻ?

ChatGPT là gì và nó hoạt động như thế nào? (1)

ChatGPT là một hệ thống trí tuệ nhân tạo được phát triển để giao tiếp qua các cuộc hội thoại liên tục (conversational AI). Điều này nghĩa là khi trò chuyện, ChatGPT không chỉ dựa vào câu hỏi gần nhất mà còn hiểu và nắm bắt toàn bộ ngữ cảnh từ những lượt trao đổi trước đó. Nhờ vậy, nó có thể trả lời một cách mạch lạc và phù hợp với ý định của người dùng ngay cả trong những đoạn hội thoại dài. Tương tác với ChatGPT cũng trở nên tự nhiên gần gũi như cách con người trao đổi và cộng tác.

ChatGPT được xây dựng trên nền tảng các mô hình ngôn ngữ lớn (Large Language Model (3) là Generative Pre-trained Transformer (GPT). Đây là mô hình đã được huấn luyện trước trên một lượng lớn văn bản đa dạng từ sách, bài báo, trang web... để học cách hiểu cấu trúc và ý nghĩa của ngôn ngữ tự nhiên.

Về cốt lõi (và đơn giản hoá), ChatGPT thực hiện công việc này bằng cách dự đoán từ kế tiếp trong một câu hoặc đoạn văn, dựa trên xác suất mà từ đó xuất hiện trong các dữ liệu văn bản khổng lồ mà nó đã được huấn luyện trước đó. Mình phải nhấn mạnh ở đây là từ “dự đoán”, chatGPT không thực sự hiểu mà chỉ tạo ra kết quả có vẻ tự nhiên và chính xác nhất và đây cũng là nguyên nhân dẫn tới hiện tượng ảo giác (hallucination).

Ví dụ về việc dự đoán từng từ của ChatGPT, "chỉ đơn giản là thêm vào từng từ một" (1)

Để tránh trả lời quá “máy móc” hoặc lặp lại, ChatGPT có một tham số gọi là “nhiệt độ” (temperature). Tham số này giúp mô hình không luôn chọn từ có xác suất cao nhất, mà đôi khi chọn những từ ít khả năng hơn, tạo cảm giác tự nhiên và sáng tạo hơn trong câu trả lời.

Vì số cách kết hợp từ ngữ có thể xảy ra là vô cùng lớn (lên tới hàng tỷ hoặc hàng nghìn tỷ chuỗi từ khác nhau), ChatGPT dùng các mô hình toán học để dự đoán xác suất xuất hiện của một chuỗi từ, kể cả khi chuỗi đó chưa từng có trong dữ liệu huấn luyện. Nhờ vậy, mô hình có thể tạo ra những đoạn văn dài, mạch lạc và hợp logic.

ChatGPT được xây dựng dựa trên mạng neural Transformer – một kiến trúc mạng tiên tiến, đặc biệt hiệu quả trong việc xử lý ngữ cảnh và ngôn ngữ tự nhiên.

Các model của ChatGPT sẽ trải qua 2 giai đoạn huấn luyện (1) Huấn luyện ban đầu (pre-training) trên lượng dữ liệu khổng lồ từ internet, sách, báo, mã nguồn…; (2) Tinh chỉnh (fine-tuning) qua Reinforcement Learning from Human Feedback (RLHF) để phản hồi sát với mong muốn của con người hơn.

Tips: Nếu bạn để ý ở cuối mỗi kết quả của ChatGPT đều có phần đánh giá. Đây là một trong những cách để cải thiện mô hình. Ngoài ra, chúng ta cũng có thể phản hồi trực tiếp với câu trả lời của chatgpt như “rất tốt” “cách trả lời rất đúng phong cách của tôi”…không phải vì mình lịch sự khách sáo đâu, mà đây là cách để chatgpt học và ghi nhớ và có thể tiếp tục lặp lại kết quả như ta mong muốn.

Phiên bản mới nhất: Phiên bản mới nhất của ChatGPT là GPT-5, được OpenAI ra mắt vào tháng 8 năm 2025. Được công bố là phiên bản mạnh nhất từng được phát triển (và có lẽ là thị phi nhất :p) — có thể tự chọn phương án suy nghĩ sâu hay nhanh tùy độ phức tạp, tích hợp “thinking router”, mang đến khả năng phản hồi ở cấp độ chuyên gia, cải thiện tốc độ, giảm sai sót và giảm hallucination, được cung cấp cho tất cả người dùng, bao gồm cả phiên bản miễn phí và trả phí (4). Tuy nhiên mình không tìm thấy thông tin chính thức từ OpenAI về ngày cuối cùng mô hình -5 được đào tạo (knowledge cutoff date).

ChatGPT có thể làm gì?

Khả năng của ChatGPT hiện nay đã vượt xa rất nhiều so với những cuộc hội thoại đơn thuần. Trong vài tháng gần đây, OpenAI đã bổ sung hàng loạt tính năng mới như nghiên cứu chuyên sâu, tìm kiếm thông tin trên mạng, hỗ trợ học tập, và đặc biệt là tác nhân AI (AI agents).

Trò chuyện giải trí với ChatGPT thậm chí viết hay sáng tạo nội dung cũng chỉ được xem là mức độ sử dụng cơ bản. Giờ đây, ChatGPT có thể phân tích dữ liệu bằng các mô hình phức tạp, hỗ trợ quá trình nghiên cứu từ khâu tìm kiếm, tổng hợp, phân tích thông tin cho đến đưa ra khuyến nghị. Trong giáo dục, nó có thể đóng vai trò gia sư cá nhân hóa, định hướng học tập và trao đổi như một người thầy trực tuyến.

Với tác nhân AI, ChatGPT không chỉ “nói” mà còn có thể “làm” — thực hiện các quy trình nhiều bước phức tạp thay vì chỉ xử lý từng tác vụ đơn lẻ. Ví dụ, nó có thể tự động tìm kiếm dữ liệu nghiên cứu thị trường, phân tích, và báo cáo kết quả dưới dạng văn bản hoặc biểu đồ trực quan. Nếu được kết nối với các công cụ cá nhân, tác nhân AI có thể hỗ trợ đặt vé xem phim, kiểm tra và sắp xếp lịch hẹn, trả lời email… Tiềm năng này đưa ChatGPT tiến gần hơn bao giờ hết tới hình ảnh một trợ lý ảo toàn diện.

Nghe toàn năng là vậy, nhưng ChatGPT vẫn có giới hạn

ChatGPT không mặc định truy cập trực tiếp Internet, nên bị giới hạn bởi mốc thời gian dữ liệu huấn luyện (knowledge cutoff). Phiên bản gần đây nhất là GPT-4o có ngày cutoff vào tháng 10/2023. Điều này khiến mô hình không biết về các sự kiện, thông tin hoặc mô hình xuất hiện sau thời điểm đó, trừ khi được tích hợp thêm công cụ tìm kiếm hoặc truy xuất dữ liệu thực tế.

Vì được huấn luyện từ lượng dữ liệu khổng lồ trên Internet, ChatGPT có thể vô tình tái tạo hoặc khuếch đại các định kiến xã hội, thiên kiến giới, văn hóa hoặc thông tin sai lệch (5). Ví dụ:

- Thiên kiến giới thường bị giản lược thành nhị phân (nam/nữ) vì dễ đo lường đối với các hệ thống học máy.

- Các mô hình giải đại từ (coreference resolution) có xu hướng gán mặc định nghề nghiệp cho nam giới, như “manager → he” hoặc các mối liên hệ kiểu “man = programmer, woman = homemaker”.

- Hệ thống nhận diện khuôn mặt có thể hoạt động kém chính xác hơn với phụ nữ da màu.

Tips: Hãy ghi nhớ nguyên tắc “garbage in, garbage out”: nếu đầu vào của hệ thống AI chứa dữ liệu kém chất lượng hoặc thiên kiến, kết quả đầu ra không thể tốt. Vì vậy, việc dùng ChatGPT cho các vấn đề chuyên môn cao như y tế, kinh tế, hay kỹ thuật cần được cân nhắc kỹ lưỡng.

Mặc dù thường đưa ra câu trả lời mạch lạc, ChatGPT không thực sự “hiểu” và trong nhiều trường hợp có thể bịa thông tin để duy trì tính logic trong phản hồi. Đây chính là hiện tượng “ảo giác” (hallucination) — khi mô hình tạo ra nội dung nghe rất thuyết phục nhưng lại sai hoàn toàn. Nguyên nhân có thể do thiếu dữ liệu đầu vào hoặc dữ liệu đã cũ so với câu hỏi.

Vì vậy, người dùng cần luôn kiểm tra lại kết quả. Nếu không chắc chắn về tính chính xác, hãy sử dụng tích hợp truy xuất thông tin thực tế (Retrieval Augmented Generation – RAG) như chế độ deep research, web browser, hoặc yêu cầu ChatGPT dẫn nguồn và kiểm tra lại nguồn đó. Tuy nhiên, lưu ý rằng đôi khi ChatGPT có thể bịa cả nguồn, hoặc dẫn liên kết nhưng nội dung không tồn tại. Ngoài ra, bạn có thể thiết kế prompt để yêu cầu ChatGPT thông báo khi không chắc chắn hoặc thiếu thông tin, nhằm tránh cung cấp dữ liệu sai lệch.

Tips: Khi cần tìm kiếm thông tin chính xác, mình thường không dùng ChatGPT mà chọnPerplexity— cũng là một hệ thống RAG, nhưng kết quả và nguồn đáng tin cậy hơn nhiều.

Hàng nghìn cuộc trò chuyện ChatGPT bị rò rỉ công khai trên Google

Cũng trong tháng 8 này, báo cáo từ Fast company cho thấy hàng nghìn cuộc trò chuyện riêng tư trên ChatGPT đã bị Google lập chỉ mục, bao gồm thông tin cá nhân, y tế, trải nghiệm cá nhân khiến việc xác định danh tính trở nên khả thi. Nguyên nhân là do tính năng “Share chat” tạo một đường link công khai có thể lập chỉ mục cho các công cụ tìm kiếm. Sau sự kiện này OpenAI đã tạm đóng tính năng này, nhưng đây cũng là một lời nhắc về rủi ro khi chúng ta vô tư chia sẻ thông tin và hình ảnh cá nhân với các nền tảng AI.

Vấn đề bảo mật dữ liệu còn quan trọng hơn khi giờ đây chúng ta dùng ChatGPT cho công việc. Với bản Enterprise, chatGPT có những cam kết về mặt bảo mật, tuy nhiên các bản khác thì không. Việc đảm bảo nhân viên hiểu rõ nguy cơ và xác định loại tài liệu, thông tin có thể chia sẻ sử dụng trên các nền tảng AI cũng như việc thiết lập bảo mật trên tài khoản là rất quan trọng đối với tổ chức và doanh nghiệp.

ChatGPT cũng dễ dàng bị tin tặc tấn công. Chỉ 1 ngày sau khi mô hình 5 được ra mắt, một chuyên gia khoa học dữ liệu đã tuyên bố mình đã “bẻ khoá” - loại bỏ các giới hạn phần mềm (jailbroken) của mô hình này (6) cho phép các nhà nghiên cứu thao túng GPT-5 để tạo ra nội dung có hại, chẳng hạn như hướng dẫn chi tiết cách tạo bom xăng Molotov, vượt qua các biện pháp ngăn chặn mà không cần đưa ra các câu lệnh độc hại rõ ràng.

Ở phần tài liệu tham khảo, mình có đính kèm checklist của Google về sử dụng công cụ AI tạo sinh một cách có trách nhiệm. Cách đây một năm, mình đã xây dựng quy định sử dụng AI cho tổ chức mình đã làm việc và đến nay vẫn tiếp tục hỗ trợ nhiều đơn vị nhà nước và doanh nghiệp tư nhân trong việc hoàn thiện quy định này. Nếu bạn cần hỗ trợ hoặc muốn tham khảo ví dụ, cứ nhắn cho mình nhé.

ChatGPT và các công cụ conversational AI phổ biến khác

Chọn phiên bản ChatGPT phù hợp

Vậy ở bước đầu tiên để trở thành một người dùng dẫn đầu chính là hiểu rõ về tiềm năng và cả giới hạn của công nghệ này. ChatGPT đã phát triển vượt xa một công cụ trò chuyện đơn thuần và đang trở thành trợ lý AI toàn diện với khả năng suy luận, sáng tạo nội dung, phân tích dữ liệu và hỗ trợ quy trình phức tạp. Tuy nhiên, mô hình này vẫn tồn tại những giới hạn như thiên kiến từ dữ liệu huấn luyện và hiện tượng “ảo giác” khi tạo ra thông tin sai. Vì vậy, người dùng cần kết hợp ChatGPT với các công cụ truy xuất thông tin đáng tin cậy, tuân thủ các nguyên tắc bảo mật dữ liệu và quan trọng nhất là luôn luôn kiểm chứng kết quả.

Bài viết tiếp theo mình sẽ chia sẻ hướng dẫn các bước thiết lập ChatGPT như một người dùng chuyên nghiệp dể có thể tối ưu hoá giao diện, thiết lập bảo mật và tăng tính cá nhân hoá.