Công cụ & kỹ thuật

"Search as Code": để model tự viết pipeline tra cứu — builder Việt nên mừng hay nên dè?

Perplexity vừa cho model tự viết đoạn Python điều phối tìm kiếm thay vì gọi API cố định, tuyên bố tiết kiệm tới 85% token ở vài tác vụ. Nghe hấp dẫn cho ai đang dựng RAG, nhưng với bot tra cứu giá/dịch vụ của DN Việt, "để model tự lo" có thể là con dao hai lưỡi.

Công cụ & kỹ thuật

Coding agent — một builder làm được khối lượng của cả team (và cái bẫy đi kèm)

Salesforce nói coding agent rút một vụ migration từ 231 ngày xuống 13 ngày, ít sự cố hơn. Với một solo builder bán dịch vụ AI ở VN, đây không phải tin vui chung chung — nó đổi thẳng cái bạn dám nhận. Nhưng có một cái bẫy mà chính dân open-source đang gắt lên vì nó.

Công cụ & kỹ thuật

Multi-agent orchestration — khi nào builder VN nên dùng, khi nào là hố token

Anthropic đang đẩy thông điệp "đừng prompt Claude, hãy xây một đội agent tự prompt nhau". Hay — cho việc build sản phẩm. Nhưng nhồi cả đội agent vào con bot bạn bán cho khách thì đó là hố token, không phải nâng cấp. Đây là ranh giới tôi tự vạch sau khi chạy cả hai bên.

Công cụ & kỹ thuật

Tự host LLM để giữ data on-prem — khi nào đáng, khi nào là tự hành xác

Tuần này dân kỹ thuật khoe nhét Tesla V100 cũ vào PC chạy Llama 3 70B, và một loạt AI workspace tự host (Odysseus, AnythingLLM, Open WebUI) lên top Hacker News. Nghe như giải pháp giữ data khách không rời máy. Nhưng tự host là một quyết định kiến trúc, không phải một cuối tuần nghịch GPU — đây là khung tôi dùng để quyết.