Khi 1 agent không đủ — Orchestrator, Workers, A2A, Shared State.
Single agent giới hạn ở đâu
Prompt Chaining · Routing · Parallel · Orchestrator-Workers · Evaluator-Optimizer
Hierarchical · Network · Sequential — shared vs isolated state
Handoff format. Khi nào / vì sao cần
CrewAI · LangGraph · Google ADK · AutoGen + bài học từ Anthropic
Context bloat — chứa system prompt + tool defs cho mọi vai trò → ngạt.
Skill drift — model nhảy giữa "code reviewer", "PM", "researcher" → không sâu việc nào.
Cost không ưu — chạy model lớn cho cả task scan đơn giản.
Khó debug — chuỗi quyết định dài, hard to trace nguyên nhân.
Không song song — tuần tự ngay cả khi 3 task độc lập.
Mỗi agent chuyên 1 vai → system prompt ngắn, tool đúng cho vai.
Context riêng cho từng worker → không nhiễm chéo.
Mix model theo vai → tiết kiệm cost 3-10x.
Trace theo agent → dễ tìm "agent nào hỏng".
Workers chạy song song → giảm latency.
⚠️ Trade-off: multi-agent đắt 15× token hơn chat thường (case study Anthropic). Cần task đủ giá trị để bù chi phí.
1 agent với 50 tools, gọi tools là "agents". Không có context riêng, không có handoff format → vẫn là 1 agent bự.
Mỗi agent có context riêng, system prompt riêng, model riêng, và giao tiếp qua structured handoff.
Tiêu chí phân biệt: "Agent A có nhìn thấy toàn bộ context của Agent B không?" — Nếu có → vẫn là 1 agent. Nếu không → multi-agent thật.
© Anthropic — Building Effective Agents (2024)
Khi nào dùng
Ví dụ điển hình
Chi tiết: S-05 — Prompt Chaining.
© Anthropic — Building Effective Agents (2024)
Khi nào dùng
Ví dụ điển hình
Chi tiết: S-06 — Routing & Parallelization.
© Anthropic — Building Effective Agents (2024)
2 biến thể
Chia task thành phần độc lập (vd: prompt + safety check) chạy đồng thời.
Cùng task chạy nhiều lần → lấy majority vote hoặc best score.
Khi nào dùng
© Anthropic — Building Effective Agents (2024)
Cách hoạt động
Khác với "Workflow Sectioning"?
Đây là pattern phổ biến nhất cho Agentic AI trong production.
© Anthropic — Building Effective Agents (2024)
Cách hoạt động
Khi nào dùng
Cẩn thận: max iterations để tránh loop. Eval phải khắc khe hơn generate.
1 lead phân chia task xuống workers. Workers không nói chuyện trực tiếp với nhau.
Vd: Anthropic research system (Opus → Sonnet workers).
Output A là input B, B là input C. Đơn giản, dễ debug. Không song song.
Vd: outline → draft → edit → publish.
Mọi agent giao tiếp với nhau theo cần. Linh hoạt nhất nhưng khó kiểm soát.
Vd: AutoGen group chat, debate framework.
Quy tắc thực chiến: bắt đầu Hierarchical. Nâng lên Network khi thực sự cần.
3 chiến lược
Mỗi agent chỉ thấy handoff từ agent trước. Đơn giản, isolated.
Hợp với: pipeline / hierarchical.
Có file / object chung mà mọi agent đọc-ghi (vd: LangGraph state).
Hợp với: workflow phức tạp cần đồng bộ.
DB / Redis / Vector store làm "single source of truth".
Hợp với: agent dài hạn, xuyên phiên.
Trade-off bảng nhanh
| Cách | Đơn giản | Khả năng đồng bộ | Cost |
|---|---|---|---|
| Message-pass | ✅✅✅ | ✅ | ✅✅✅ |
| Scratchpad | ✅✅ | ✅✅ | ✅✅ |
| External | ✅ | ✅✅✅ | ✅ |
Quy tắc
Schema handoff
Worker chỉ nhận handoff này — không cần thấy toàn bộ context của orchestrator.
Vì sao chuẩn hoá quan trọng
Chuẩn đang nổi
MCP (Model Context Protocol) đang chuẩn hoá tool-call.
A2A (Agent-to-Agent) chuẩn hoá agent handoff.
Sẽ đào sâu ở S-10.
Role · Task · Crew
Abstraction "đội ngũ chuyên gia". Mỗi role có goal, backstory, tools. Sequential / Hierarchical process.
Hợp với: bài toán theo vai trò nghề nghiệp rõ.
Nodes · Edges · State
Graph có state. Edges có thể conditional. Cho phép loop, branch, human-in-the-loop checkpoint.
Hợp với: workflow có rẽ nhánh phức tạp, cần kiểm soát state chi tiết.
Conversable agents · Group chat
Agent là entity hội thoại. Có thể chat với nhau theo round-robin, manager, hoặc swarm.
Hợp với: debate, research, brainstorming.
Agent kit on Vertex AI
Bộ tool build / eval / deploy agent. Tích hợp Gemini, A2A, Vertex Agent Engine.
Hợp với: doanh nghiệp cần production-grade trên GCP.
Tất cả đều hiện thực 5 pattern bên trên — chỉ khác cú pháp & mức độ tự động hoá.
© Anthropic — How we built our multi-agent research system (2025)
Kiến trúc
Số liệu
Bài học
"Mọi thứ phải là multi-agent" — task đơn giản chia 5 agent → cost x10, latency x5 mà chất lượng tệ hơn.
Handoff to dài — copy nguyên context giữa các agent → mất ý nghĩa cô lập.
Network topology mặc định — N agent x N edges → khó debug, dễ loop.
Không max iterations — evaluator-optimizer chạy mãi.
Không trace per-agent — bug bắn ra, không biết agent nào hỏng.
Bắt đầu single agent. Chia thành multi-agent chỉ khi đo được giá trị.
Handoff tóm tắt ≤ 2k tokens, có schema.
Mặc định Hierarchical. Nâng Network chỉ khi cần debate/cross-check.
Max steps + budget + signal "done" rõ.
Tracing per-agent (LangSmith / Langfuse / OpenTelemetry).
Multi-agent ≠ many tools. Tiêu chí: agent có context riêng + giao tiếp structured handoff.
5 pattern lõi: Chaining · Routing · Parallel · Orchestrator-Workers · Evaluator-Optimizer. Hầu hết hệ thực = combo của chúng.
Bắt đầu Hierarchical + message-pass. Lên Network / shared state chỉ khi đo được giá trị.
Multi-agent đắt 15× token — cần task đủ giá trị. Số liệu Anthropic: +90% chất lượng, nhưng cost & reliability phải đong đo.
Handoff chuẩn hoá schema = ngày mai đổi framework / model / agent vẫn chạy. MCP & A2A đang thành chuẩn chung.