Không phải bản tin AI. Đây là góc nhìn của một người đang build & bán sản phẩm AI thật: mỗi bài lấy một tin/xu hướng và trả lời “việc này đổi gì cho người làm sản phẩm AI ở Việt Nam”.
Cursor không tự train model nào, chỉ bọc UX trên Claude/GPT — đúng định nghĩa "thin wrapper" mà ai cũng chê. Vậy mà nó định giá hàng tỷ đô và bị Uber cap chi tiêu như một khoản nặng. Mổ xẻ mô hình kinh doanh của nó để rút ra ba thứ cho người đang build bot AI ở VN.
Áp dụng cho DN ViệtLuật bảo vệ dữ liệu cá nhân (PDPL 2025) đổi câu hỏi từ "bot trả lời có hay không" sang "ai chịu trách nhiệm cho dữ liệu khách". Nếu bạn nhét số điện thoại và lịch sử khách vào prompt gửi lên model nước ngoài, người chịu trách nhiệm là bạn, không phải OpenAI. Đây là cách tôi thiết kế bot để tôn trọng dữ liệu khách — và biến nó thành điểm bán.
Công cụ & kỹ thuậtPerplexity vừa cho model tự viết đoạn Python điều phối tìm kiếm thay vì gọi API cố định, tuyên bố tiết kiệm tới 85% token ở vài tác vụ. Nghe hấp dẫn cho ai đang dựng RAG, nhưng với bot tra cứu giá/dịch vụ của DN Việt, "để model tự lo" có thể là con dao hai lưỡi.
Chính sách & ngànhAnthropic vượt OpenAI thành startup AI giá trị nhất, nộp draft S-1, giành luôn kỹ sư chip của đối thủ — cả ngành đang đốt hàng chục tỉ đô để đua lên sàn. Tin này không bảo bạn chọn phe. Nó nói cho một builder nhỏ ở VN biết nên xây ở tầng nào và sợ điều gì.
Công cụ & kỹ thuậtSalesforce nói coding agent rút một vụ migration từ 231 ngày xuống 13 ngày, ít sự cố hơn. Với một solo builder bán dịch vụ AI ở VN, đây không phải tin vui chung chung — nó đổi thẳng cái bạn dám nhận. Nhưng có một cái bẫy mà chính dân open-source đang gắt lên vì nó.
Công cụ & kỹ thuậtAnthropic đang đẩy thông điệp "đừng prompt Claude, hãy xây một đội agent tự prompt nhau". Hay — cho việc build sản phẩm. Nhưng nhồi cả đội agent vào con bot bạn bán cho khách thì đó là hố token, không phải nâng cấp. Đây là ranh giới tôi tự vạch sau khi chạy cả hai bên.
Mô hình mớiMiniMax M3 ra model open-weight với cửa sổ context 1 triệu token, lần đầu một model mở thật sự đua được long-context với nhóm đóng. Nghe như "khỏi cần RAG nữa". Với người dựng bot tra cứu tài liệu cho DN Việt, sự thật phức tạp hơn — và đắt hơn — thế.
Chính sách & ngànhMột bài "Mình huỷ subscription AI rồi" viral 336 điểm trên Hacker News, châm ngòi tranh luận ROI gói $20/tháng. Làn sóng "AI sub fatigue" này là tin tốt cho người bán dịch vụ AI ở VN — nếu bạn bán đúng thứ. Vì sao bot CSKH 3,9tr/tháng sống được khi ChatGPT $20 bị huỷ.
Mô hình mớiOpus 4.8 mạnh hơn 4.7 nhưng nói ngắn hơn ~35% — giá mỗi triệu token giữ nguyên, nên hóa đơn mỗi lượt bot trả lời tụt theo. Câu hỏi thật cho người build không phải "model nào điểm cao" mà "nâng đời có rẻ hơn cho con bot đang chạy không". Tôi tính thử trên bot CSKH thật.
Chính sách & ngànhMột DN trả 500 triệu USD tiền Claude trong một tháng vì quên đặt cap. Uber cháy ngân sách AI cả năm trong 4 tháng. Đây không phải chuyện của ông lớn — chi phí token là rủi ro sống còn với bất kỳ ai vận hành bot ở VN, và phần lớn nó nằm trong tay người build.
Mô hình mớiQwen 3.7 Max bị nói là chỉ kém model Mỹ 1 điểm benchmark nhưng rẻ hơn nhiều lần. DeepSeek đang dẫn bảng phần mềm hot ở Mỹ vì giá. Vậy con bot CSKH bạn bán cho spa có nên bỏ Claude để chạy model rẻ không? Câu trả lời của tôi không phải "có" hay "không".
Áp dụng cho DN ViệtNghiên cứu mới chỉ ra Perplexity, ChatGPT Search, Claude và Gemini web search thường XÁC NHẬN điều model đã biết thay vì thật sự đọc web — confirmation bias. Với DN Việt dùng AI tra cứu thị trường hay dựng bot tra giá, đây là rủi ro trả "số liệu 2024" mà nghe như vừa cập nhật. Cách phòng nằm ở kiến trúc, không ở model.
Áp dụng cho DN ViệtTuần này OpenAI ra "Lockdown Mode" và thừa nhận chưa diệt được prompt injection. Con bot CSKH bạn bán cho spa cũng dính cửa này. Đây là cách tôi phòng nó trong sản phẩm thật.
Công cụ & kỹ thuậtTuần này dân kỹ thuật khoe nhét Tesla V100 cũ vào PC chạy Llama 3 70B, và một loạt AI workspace tự host (Odysseus, AnythingLLM, Open WebUI) lên top Hacker News. Nghe như giải pháp giữ data khách không rời máy. Nhưng tự host là một quyết định kiến trúc, không phải một cuối tuần nghịch GPU — đây là khung tôi dùng để quyết.