Model mới ra mắt — điều thực sự thay đổi với người build, bỏ qua hype.
Cursor không tự train model nào, chỉ bọc UX trên Claude/GPT — đúng định nghĩa "thin wrapper" mà ai cũng chê. Vậy mà nó định giá hàng tỷ đô và bị Uber cap chi tiêu như một khoản nặng. Mổ xẻ mô hình kinh doanh của nó để rút ra ba thứ cho người đang build bot AI ở VN.
Mô hình mớiMiniMax M3 ra model open-weight với cửa sổ context 1 triệu token, lần đầu một model mở thật sự đua được long-context với nhóm đóng. Nghe như "khỏi cần RAG nữa". Với người dựng bot tra cứu tài liệu cho DN Việt, sự thật phức tạp hơn — và đắt hơn — thế.
Mô hình mớiOpus 4.8 mạnh hơn 4.7 nhưng nói ngắn hơn ~35% — giá mỗi triệu token giữ nguyên, nên hóa đơn mỗi lượt bot trả lời tụt theo. Câu hỏi thật cho người build không phải "model nào điểm cao" mà "nâng đời có rẻ hơn cho con bot đang chạy không". Tôi tính thử trên bot CSKH thật.
Mô hình mớiQwen 3.7 Max bị nói là chỉ kém model Mỹ 1 điểm benchmark nhưng rẻ hơn nhiều lần. DeepSeek đang dẫn bảng phần mềm hot ở Mỹ vì giá. Vậy con bot CSKH bạn bán cho spa có nên bỏ Claude để chạy model rẻ không? Câu trả lời của tôi không phải "có" hay "không".