Cái Anthropic mới quảng bá rầm rộ — tôi đã chạy nó mấy tháng nay rồi
Mấy hôm nay trên feed của tôi tràn ngập một thông điệp mới của Anthropic: đừng ngồi chat với Claude từng prompt nữa — hãy xây một hệ thống tự prompt chính nó.
Một đội agent có vai trò như team phát triển thật: một con làm PM viết yêu cầu, một con lo UI/UX, một con là kỹ sư dựng backend, một con lo bảo mật, một con phân tích dữ liệu. Con người không gõ lệnh nữa — con người thiết kế quy trình, để các agent tự sinh prompt cho nhau.
Tôi đọc xong và mỉm cười. Không phải vì nó mới. Mà vì tôi đã chạy đúng cái đó mấy tháng nay rồi.
Tôi không bình tin — tôi đang vận hành nó
Hệ thống tôi dùng để build con bot spa của mình có một cái tên rất quê: "điều phối ba tầng". Nó hoạt động y hệt cái Anthropic đang quảng bá, chỉ là tôi không gọi mấy con agent là PM hay SWE.
Tầng trên cùng là tôi — chốt làm gì, phạm vi tới đâu, tiêu chí thế nào là xong.
Tầng giữa là một "nhạc trưởng": đọc việc tôi chốt, băm nhỏ ra thành các task, rồi rải xuống cho lính.
Tầng dưới là đám lính: một con viết code và tự chạy test trong một góc làm việc cô lập rồi nộp lại bản vá; một con khác soi gắt bản vá đó trước khi cho nhập; một con lo deploy. Code nào test đỏ hoặc đụng nhau là dừng, hỏi tôi, không tự ép cho qua.
Nghe quen không? Đó chính xác là "đội agent tự prompt cho nhau" — chỉ khác là tôi đã trầy da với nó trong code thật, không phải trong một video demo. Và vì đã trầy thật, tôi rút ra ba điều mà cái bài quảng bá kia khéo léo không nói.
Bài học 1: Giá trị nằm ở cái BÀN GIAO giữa các chặng, không phải ở số lượng agent
Người mới nghe "đội agent" hay tưởng phép màu nằm ở số lượng — càng nhiều con bot càng giỏi. Sai.
Phép màu nằm ở cái được trao tay giữa hai chặng và cái cổng kiểm tra ở giữa. PM giao cho UI/UX không phải một câu nói, mà một bản yêu cầu rõ. UI/UX giao cho kỹ sư một bản thiết kế cụ thể. Mỗi lần trao tay là một artifact sạch, kiểm được.
Trong hệ của tôi, cái cổng đó là test phải xanh mới được nhập code. Con lính viết xong một mẩu, test chạy, đỏ thì mẩu đó bị loại ra — không được trộn vào phần đang chạy ngon. Chính cái cổng đó giữ chất lượng, chứ không phải việc tôi có bao nhiêu con agent.
Bạn không cần một đội đông. Bạn cần ranh giới rõ giữa các chặng và một cái cổng chặn rác. Thêm agent mà không có cổng thì chỉ là thêm chỗ để hỏng.
Bài học 2: Cái đáng tiền là DÂY NỐI vào dữ liệu thật — không phải multi-agent
Phần đắt giá nhất trong bài Anthropic không phải đám agent. Là chỗ họ nối thẳng Claude vào hệ thống đám mây thật của Google — để nó đọc tài liệu mới nhất, làm việc với cơ sở dữ liệu thật, deploy lên hạ tầng thật. Cái cầu nối đó họ gọi là MCP.
Đây mới là cú nhảy năng lực thật. Một con AI dù thông minh tới đâu, nếu không cắm được vào dữ liệu thật của bạn thì nó chỉ đoán mò trong cái nó học thuộc lòng từ năm ngoái.
Với con bot của tôi cũng vậy. Nó giỏi lên không nhờ tôi thêm agent. Nó giỏi lên khi nó cắm được vào dữ liệu thật của khách — kho dịch vụ, bảng giá, lịch hẹn. Đó là chỗ tiền nằm. Nếu bạn chỉ có một đồng để đầu tư, đừng đổ vào việc đẻ thêm bot. Đổ vào dây nối vào dữ liệu thật.
Bài học 3: Demo là happy-path — phần khó 80% bị giấu
Đây là điều tôi muốn người mới build dán lên màn hình.
Mọi cái demo multi-agent đều quay đúng lúc nó chạy ngon. Phần 80% còn lại — phần thật sự khó — bị cắt khỏi video:
Làm sao các agent nhìn cùng một bối cảnh? Tôi từng dính một cú dở khóc dở cười: một con lính branch từ code cũ, nên nó không thấy phần một con khác vừa làm xong — nộp ra một bản vá lệch pha, thiếu cả import. Đồng bộ bối cảnh giữa các agent là một bài toán thật, không phải chuyện hiển nhiên.
Làm sao xử lý khi một agent làm sai? Phải có luật cứng: test đỏ là dừng, hỏi người. Không có luật đó, một con sai sẽ kéo cả dây cùng sai.
Và cái này ít ai nhắc: chi phí token. Agent tự prompt agent nghĩa là token đẻ ra token. Một việc bạn tự làm tốn một lần gọi; để một đội agent làm có thể tốn gấp năm gấp mười. Tiện thì có tiện, nhưng hoá đơn thì rất thật.
Một nhịp cảnh giác: "để agent tự lo hết" là cái bẫy khi bán sản phẩm
Đây là chỗ tôi tách khỏi đám hype.
Multi-agent tuyệt vời trong xưởng — tức là dùng nó để phát triển sản phẩm, đúng cái tôi đang làm. Nhưng đừng mặc định nhồi cả một đội agent vào sản phẩm bạn bán ra cho khách.
Chị chủ spa trả tiền cho tôi không mua "một đội ngũ AI". Chị mua một thứ: khách nhắn được trả lời đúng, rẻ, không phiền. Nếu tôi nhét năm con agent vào để trả lời một câu hỏi đơn giản, tôi vừa làm chậm hơn, vừa đốt token gấp bội, vừa tạo thêm năm chỗ để hỏng — tất cả để khoe một kiến trúc mà khách không thèm quan tâm.
Đừng quên: Anthropic không trung lập về chuyện này. Nhiều agent = nhiều token = nhiều tiền cho họ. Lời khuyên của họ đúng về kỹ thuật, nhưng có động cơ thương mại. Việc của người build là tỉnh táo: dùng đội agent để làm ra sản phẩm, không phải để làm nặng sản phẩm.
Bài học mang đi
Cái Anthropic quảng bá không phải kiến trúc mới — nó là sự xác nhận một hướng đi mà những người build nghiêm túc đã đi rồi: thôi làm con người gõ từng prompt, trở thành người thiết kế luồng.
Nhưng đừng để cái demo bóng bẩy lừa. Giá trị không ở số lượng agent — nó ở ranh giới rõ giữa các chặng, cái cổng chặn rác, và dây nối vào dữ liệu thật. Phần còn lại là chi phí và rủi ro mà người ta quên quay vào video.
Và nhớ: đội agent là công cụ trong xưởng của bạn, không phải món đồ trang trí để nhét vào sản phẩm bán ra.
👉 Muốn tự tay build một con bot AI thật — và hiểu khi nào nên để một con AI làm, khi nào nên một đội, khi nào nên dừng lại vì khách chỉ cần một câu trả lời đúng? Bắt đầu với mini-course miễn phí: Bot AI đầu tiên của bạn — làm xong trong một buổi tối, và bạn sẽ thôi bị mấy cái demo multi-agent làm hoa mắt.