AI vừa search xong vẫn trả cho bạn số liệu cũ — và nó nói rất tự tin
Bạn bảo con AI "search giúp tôi giá thị trường mới nhất". Nó search thật, có dẫn link hẳn hoi — rồi trả cho bạn con số của năm ngoái. Không phải nó lười. Một nghiên cứu vừa công bố cho thấy đây là khuyết tật thiết kế của gần như mọi công cụ AI search hiện nay.
Tin này dễ bị bỏ qua giữa rừng tin "model mới mạnh hơn", nhưng nếu bạn đang dùng AI để tra cứu — hoặc tệ hơn, đang dựng bot tra cứu cho khách — thì nó nói thẳng về độ tin cậy thứ bạn đang bán.
Tóm tắt cho người bận
- Nghiên cứu mới chỉ ra Perplexity, ChatGPT Search, Claude web search và Gemini Search đều có confirmation bias mạnh: câu trả lời nghiêng nặng về kiến thức trong training data, kể cả khi kết quả web tươi nói khác (nguồn: the-decoder, 31.05.2026).
- Nghĩa là model vừa search xong vẫn có thể trả thông tin cũ — và trình bày tự tin như vừa cập nhật. Đây là vấn đề thiết kế, không sửa được bằng cách viết prompt khéo hơn.
- Hệ quả cho người build: nếu bot của bạn "nhớ" giá, nhớ chính sách, nhớ số liệu thay vì đọc lại nguồn thật mỗi lần, nó sẽ tự tin trả sai. Và trả sai một cách thuyết phục thì nguy hơn trả "tôi không biết".
Chuyện gì thực sự xảy ra
Người ta hay tưởng bật web search lên là AI sẽ "lấy số liệu mới". Nghiên cứu này lật lại: kể cả khi search trả về kết quả mâu thuẫn với thứ model đã học, câu trả lời cuối vẫn bám vào ký ức của model. Web search trở thành thứ trang trí — model đọc lướt rồi vẫn trả lời theo cái nó "tin".
Đặt cạnh đời thực thì rõ. Bạn hỏi "thuế VAT dịch vụ spa hiện tại bao nhiêu", "giá thuê mặt bằng quận 1 trung bình", "đối thủ X đang bán gói nào". Model đã đọc những con số này từ dữ liệu huấn luyện chốt ở một thời điểm trong quá khứ. Khi bạn hỏi, nó ưu tiên trả cái cũ đó — và một câu trả lời mượt mà, có dẫn link, đọc y như vừa nghiên cứu xong.
Đây chính là chỗ nguy: AI sai mà trông không giống đang sai. Nó không ậm ừ, không nói "tôi không chắc". Nó trả một con số gọn gàng. Người dùng tin. Quyết định kinh doanh đi theo con số đó.
Góc builder: bot tra cứu của bạn dính ở đâu
Tôi đang chạy thật một bot CSKH cho spa. Tình huống kinh điển: khách nhắn "Gói chăm sóc da mặt bao nhiêu tiền?".
Có hai cách dựng con bot này, và khác biệt giữa chúng quyết định bạn bán được hay không.
Cách sai (bot "nhớ" giá): bạn nhét bảng giá vào system prompt hoặc tin rằng model "biết" giá. Vấn đề kép. Một, spa đổi giá tháng 3 nhưng prompt vẫn giá tháng 1 — bot báo sai, khách tới nơi mới biết, mất uy tín. Hai, đây đúng là phiên bản thu nhỏ của confirmation bias: model trả cái nó "nhớ" thay vì đọc nguồn sự thật hiện tại. Một con bot trả giá cũ một cách tự tin còn tệ hơn một con bot nói "để em kiểm tra lại".
Cách đúng (bot đọc DB mỗi lần): giá nằm trong database, là nguồn sự thật duy nhất. Mỗi lần khách hỏi giá, bot truy vấn DB tại thời điểm đó rồi mới trả lời. Model không được phép "nhớ" giá — nhiệm vụ của nó chỉ là diễn đạt con số vừa đọc cho tự nhiên. Spa đổi giá trong admin, câu trả lời đổi theo ngay, không cần sửa prompt, không cần huấn luyện lại.
Khác biệt nghe nhỏ nhưng là ranh giới giữa "con bot demo" và "con bot bán được". Cái thứ hai phải không bao giờ tự bịa con số nào nó không vừa đọc từ nguồn thật.
Ba nguyên tắc tôi áp để bot không trả tin cũ
Không cần model thông minh hơn. Cần kỷ luật kiến trúc:
- Ground vào dữ liệu nội bộ, đừng tin trí nhớ model. Mọi số liệu sống — giá, lịch trống, tồn kho, chính sách — phải đến từ DB hoặc tài liệu bạn kiểm soát (đây là phần "R" trong RAG: truy xuất trước, sinh sau). Kiến thức trong model chỉ dùng để nói chuyện cho mượt, không bao giờ dùng làm nguồn dữ kiện.
- Buộc trích nguồn cho mỗi con số. Khi bot nêu một con số, nó phải gắn được con số đó với một bản ghi cụ thể (dòng nào trong DB, tài liệu nào, cập nhật ngày nào). Không trích được nguồn thì không được nói chắc. Quy tắc này biến "trả sai tự tin" thành "trả thận trọng hoặc nhường người thật".
- Cùng câu hỏi đó với AI tra cứu của chính bạn? Đối xử y vậy. Khi bạn — chủ DN — dùng Perplexity/ChatGPT search để nghiên cứu thị trường, đừng coi đầu ra là sự thật. Hỏi lại: con số này từ nguồn nào, ngày nào? Bấm vào link kiểm tra. Đặc biệt cảnh giác với số liệu "tròn trịa quen thuộc" — đó hay là ký ức cũ của model, không phải kết quả vừa search. Một phút kiểm chứng rẻ hơn một quyết định sai.
Vậy nên làm gì tuần này
Nếu bạn đang vận hành bot tra cứu cho khách: ngồi xuống thử hỏi nó vài câu về dữ liệu vừa mới thay đổi (đổi một mức giá trong admin rồi hỏi lại ngay). Nếu bot vẫn trả số cũ — bạn vừa phát hiện nó đang "nhớ" thay vì "đọc", trước khi khách phát hiện giùm bạn.
Còn nếu bạn dùng AI để research thị trường: tập thói quen hỏi ngược "nguồn nào, ngày nào" trước mỗi con số bạn định mang vào quyết định.
Điểm mấu chốt của cả hai: một con AI hữu ích không phải con biết nhiều, mà là con biết khi nào nó không nên tin trí nhớ của chính mình. Dựng được sự kỷ luật đó vào sản phẩm chính là phần khó — và là phần tôi dạy kỹ trong mini-course miễn phí, bắt đầu từ con bot đầu tiên trả lời đúng vì nó đọc nguồn thật, không vì nó "nhớ".
Nguồn tham khảo (qua bản tin AI nội bộ tôi theo dõi hằng ngày): the-decoder.com — 31.05.2026.