Phân tích AI

AI dưới góc nhìn người làm sản phẩm

Không phải bản tin AI. Đây là góc nhìn của một người đang build & bán sản phẩm AI thật: mỗi bài lấy một tin/xu hướng và trả lời “việc này đổi gì cho người làm sản phẩm AI ở Việt Nam”.

Mô hình mới

Cursor — một "thin wrapper" định giá hàng tỷ đô, và bài học cho người bán bot AI ở VN

Cursor không tự train model nào, chỉ bọc UX trên Claude/GPT — đúng định nghĩa "thin wrapper" mà ai cũng chê. Vậy mà nó định giá hàng tỷ đô và bị Uber cap chi tiêu như một khoản nặng. Mổ xẻ mô hình kinh doanh của nó để rút ra ba thứ cho người đang build bot AI ở VN.

Áp dụng cho DN Việt

PDPL 2025 — khi bot AI của bạn gửi số điện thoại khách sang một model ở Mỹ

Luật bảo vệ dữ liệu cá nhân (PDPL 2025) đổi câu hỏi từ "bot trả lời có hay không" sang "ai chịu trách nhiệm cho dữ liệu khách". Nếu bạn nhét số điện thoại và lịch sử khách vào prompt gửi lên model nước ngoài, người chịu trách nhiệm là bạn, không phải OpenAI. Đây là cách tôi thiết kế bot để tôn trọng dữ liệu khách — và biến nó thành điểm bán.

Công cụ & kỹ thuật

"Search as Code": để model tự viết pipeline tra cứu — builder Việt nên mừng hay nên dè?

Perplexity vừa cho model tự viết đoạn Python điều phối tìm kiếm thay vì gọi API cố định, tuyên bố tiết kiệm tới 85% token ở vài tác vụ. Nghe hấp dẫn cho ai đang dựng RAG, nhưng với bot tra cứu giá/dịch vụ của DN Việt, "để model tự lo" có thể là con dao hai lưỡi.

Chính sách & ngành

Cuộc đua IPO của các lab AI — builder nhỏ ở VN đứng ở đâu trong sòng bạc này

Anthropic vượt OpenAI thành startup AI giá trị nhất, nộp draft S-1, giành luôn kỹ sư chip của đối thủ — cả ngành đang đốt hàng chục tỉ đô để đua lên sàn. Tin này không bảo bạn chọn phe. Nó nói cho một builder nhỏ ở VN biết nên xây ở tầng nào và sợ điều gì.

Công cụ & kỹ thuật

Coding agent — một builder làm được khối lượng của cả team (và cái bẫy đi kèm)

Salesforce nói coding agent rút một vụ migration từ 231 ngày xuống 13 ngày, ít sự cố hơn. Với một solo builder bán dịch vụ AI ở VN, đây không phải tin vui chung chung — nó đổi thẳng cái bạn dám nhận. Nhưng có một cái bẫy mà chính dân open-source đang gắt lên vì nó.

Công cụ & kỹ thuật

Multi-agent orchestration — khi nào builder VN nên dùng, khi nào là hố token

Anthropic đang đẩy thông điệp "đừng prompt Claude, hãy xây một đội agent tự prompt nhau". Hay — cho việc build sản phẩm. Nhưng nhồi cả đội agent vào con bot bạn bán cho khách thì đó là hố token, không phải nâng cấp. Đây là ranh giới tôi tự vạch sau khi chạy cả hai bên.

Mô hình mới

MiniMax M3 nhồi cả triệu token vào một câu hỏi — có nghĩa là bạn xoá luôn RAG không?

MiniMax M3 ra model open-weight với cửa sổ context 1 triệu token, lần đầu một model mở thật sự đua được long-context với nhóm đóng. Nghe như "khỏi cần RAG nữa". Với người dựng bot tra cứu tài liệu cho DN Việt, sự thật phức tạp hơn — và đắt hơn — thế.

Chính sách & ngành

Khách bắt đầu huỷ gói AI $20 — bài học định giá cho người bán dịch vụ AI ở VN

Một bài "Mình huỷ subscription AI rồi" viral 336 điểm trên Hacker News, châm ngòi tranh luận ROI gói $20/tháng. Làn sóng "AI sub fatigue" này là tin tốt cho người bán dịch vụ AI ở VN — nếu bạn bán đúng thứ. Vì sao bot CSKH 3,9tr/tháng sống được khi ChatGPT $20 bị huỷ.

Mô hình mới

Claude Opus 4.8 mạnh hơn mà "rẻ token" hơn — đổi gì cho người vận hành bot?

Opus 4.8 mạnh hơn 4.7 nhưng nói ngắn hơn ~35% — giá mỗi triệu token giữ nguyên, nên hóa đơn mỗi lượt bot trả lời tụt theo. Câu hỏi thật cho người build không phải "model nào điểm cao" mà "nâng đời có rẻ hơn cho con bot đang chạy không". Tôi tính thử trên bot CSKH thật.

Chính sách & ngành

Một công ty đốt 500 triệu đô tiền AI trong một tháng — và vì sao con bot của bạn cũng có cái lỗ đó

Một DN trả 500 triệu USD tiền Claude trong một tháng vì quên đặt cap. Uber cháy ngân sách AI cả năm trong 4 tháng. Đây không phải chuyện của ông lớn — chi phí token là rủi ro sống còn với bất kỳ ai vận hành bot ở VN, và phần lớn nó nằm trong tay người build.

Mô hình mới

Model mở giá rẻ đã bám sát frontier — khi nào DN Việt nên đổi khỏi API model Mỹ

Qwen 3.7 Max bị nói là chỉ kém model Mỹ 1 điểm benchmark nhưng rẻ hơn nhiều lần. DeepSeek đang dẫn bảng phần mềm hot ở Mỹ vì giá. Vậy con bot CSKH bạn bán cho spa có nên bỏ Claude để chạy model rẻ không? Câu trả lời của tôi không phải "có" hay "không".

Áp dụng cho DN Việt

AI vừa search xong vẫn trả cho bạn số liệu cũ — và nó nói rất tự tin

Nghiên cứu mới chỉ ra Perplexity, ChatGPT Search, Claude và Gemini web search thường XÁC NHẬN điều model đã biết thay vì thật sự đọc web — confirmation bias. Với DN Việt dùng AI tra cứu thị trường hay dựng bot tra giá, đây là rủi ro trả "số liệu 2024" mà nghe như vừa cập nhật. Cách phòng nằm ở kiến trúc, không ở model.

Áp dụng cho DN Việt

Prompt injection — cái cửa hậu mà mọi con bot AI bạn bán đều có

Tuần này OpenAI ra "Lockdown Mode" và thừa nhận chưa diệt được prompt injection. Con bot CSKH bạn bán cho spa cũng dính cửa này. Đây là cách tôi phòng nó trong sản phẩm thật.

Công cụ & kỹ thuật

Tự host LLM để giữ data on-prem — khi nào đáng, khi nào là tự hành xác

Tuần này dân kỹ thuật khoe nhét Tesla V100 cũ vào PC chạy Llama 3 70B, và một loạt AI workspace tự host (Odysseus, AnythingLLM, Open WebUI) lên top Hacker News. Nghe như giải pháp giữ data khách không rời máy. Nhưng tự host là một quyết định kiến trúc, không phải một cuối tuần nghịch GPU — đây là khung tôi dùng để quyết.