Tool, kiến trúc, kỹ thuật AI đáng để một builder thử tay.
Perplexity vừa cho model tự viết đoạn Python điều phối tìm kiếm thay vì gọi API cố định, tuyên bố tiết kiệm tới 85% token ở vài tác vụ. Nghe hấp dẫn cho ai đang dựng RAG, nhưng với bot tra cứu giá/dịch vụ của DN Việt, "để model tự lo" có thể là con dao hai lưỡi.
Công cụ & kỹ thuậtSalesforce nói coding agent rút một vụ migration từ 231 ngày xuống 13 ngày, ít sự cố hơn. Với một solo builder bán dịch vụ AI ở VN, đây không phải tin vui chung chung — nó đổi thẳng cái bạn dám nhận. Nhưng có một cái bẫy mà chính dân open-source đang gắt lên vì nó.
Công cụ & kỹ thuậtAnthropic đang đẩy thông điệp "đừng prompt Claude, hãy xây một đội agent tự prompt nhau". Hay — cho việc build sản phẩm. Nhưng nhồi cả đội agent vào con bot bạn bán cho khách thì đó là hố token, không phải nâng cấp. Đây là ranh giới tôi tự vạch sau khi chạy cả hai bên.
Công cụ & kỹ thuậtTuần này dân kỹ thuật khoe nhét Tesla V100 cũ vào PC chạy Llama 3 70B, và một loạt AI workspace tự host (Odysseus, AnythingLLM, Open WebUI) lên top Hacker News. Nghe như giải pháp giữ data khách không rời máy. Nhưng tự host là một quyết định kiến trúc, không phải một cuối tuần nghịch GPU — đây là khung tôi dùng để quyết.