7 thành phần cốt lõi · So sánh 5 sản phẩm thực tế.
Hub-and-spoke quanh LLM. Sơ đồ kinh điển
Reasoning · Perception · Planning · Memory · Tools · Comm · Guardrails
Claude Code · Cursor · OpenAI Assistant · Gemini CLI · Aider
Checklist thiết kế · anti-patterns · template tham khảo
Parse input (text, ảnh, file, sự kiện) — trích entity, intent, ràng buộc.
LLM nền — sinh kế hoạch, đánh giá, viết action.
Gemini · Claude · GPT · Llama …
API, DB, browser, code interpreter — mỗi tool có schema + side-effect.
Chia mục tiêu thành các bước. CoT, ReAct, Reflection.
Người ↔ agent & agent ↔ agent (A2A, MCP, structured output).
Short-term (phiên) + Long-term (vector DB, file, KV).
Lọc input/output, kiểm tra action, logging, eval định kỳ.
7 khối ghép lại → năng lực Perceive → Plan → Act → Learn. Mọi sản phẩm agent thực tế đều là một biến thể của 7 khối này.
© Lilian Weng — "LLM Powered Autonomous Agents" (2023)
Khung Lilian Weng
Khác biệt với bản 7 khối: Perception, Communication, Guardrails được tách rõ — phù hợp với hệ production.
Vai trò
Khi chọn model — 4 tiêu chí
Pattern phổ biến: Mix models
"1 model lo tất cả" rẻ thì rất đắt — task đơn giản cũng chạy model lớn. Trộn theo task tiết kiệm 3-10x.
Vai trò
Các nguồn đầu vào điển hình
Pattern: Pre-processing pipeline
Anti-pattern: nhét file PDF 200 trang nguyên xi vào prompt. Pattern tốt: tách section, chỉ giữ phần liên quan.
Model tự nói ra các bước suy luận trước khi đưa câu trả lời. Đơn giản nhất.
Khi: task có nhiều bước nhỏ.
Vòng Reason → Act → Observe. Model luân phiên suy luận và gọi tool.
Khi: cần tool use lặp đi lặp lại.
Tách rõ plan agent (1 model lớn) và execute agent (model nhỏ chạy từng bước).
Khi: workflow phức tạp, dài.
Khám phá nhiều nhánh giải pháp, đánh giá, chọn nhánh tốt.
Khi: task có giải khác nhau (giải toán, code thuật toán).
Sau khi xong, model tự critique, nhận lỗi, làm lại.
Khi: chất lượng > tốc độ.
Mọi planner cần điều kiện dừng (max steps, ngân sách token, signal "done").
Tránh: loop vô tận, "agent hyperactive".
Sẽ học sâu mỗi pattern ở S-07 (Tool Use) và S-08 (Planning & Reflection).
© Lilian Weng (2023) — Categorization of memory
3 lớp trong thực hành
Conversation history. Tự nhiên có. Giới hạn = context window.
"Lần trước user X đã làm Y." Lưu file / DB → recall khi cần.
Vector DB, knowledge graph. Search bằng nghĩa, không bằng chữ.
Chi tiết: S-09 — Memory & RAG.
Anatomy 1 tool
Tên tool + mô tả + ràng buộc → quyết định 80% chất lượng tool-use.
Checklist 1 tool an toàn
"50% chất lượng agent nằm ở thiết kế tool. LLM giỏi đến mấy mà tool tệ thì agent vẫn dở."
Chat, slash command, voice. Stream token, hiển thị tool call.
UI cho phép interrupt, edit prompt, retry — không có thì user không sửa được lỗi agent.
JSON function calling là chuẩn. MCP chuẩn hoá toolset external.
Structured output (JSON Schema, XML tags) đảm bảo parse-able giữa các bước.
Multi-agent cần handoff format chuẩn: input, output, context tóm tắt.
Sẽ học sâu ở S-04 (Agentic) và S-10 (MCP & A2A).
Nguyên tắc: càng chuẩn hoá format càng dễ thay thế thành phần. Ngày mai đổi model / tool / agent vẫn chạy.
4 lớp rào chắn
Eval & observability
LangSmith, Langfuse, OpenTelemetry — log mỗi turn, mỗi tool call để debug được.
Sẽ học sâu ở S-11.
Triết lý: file-based config, mọi thứ checked-in git.
Triết lý: tight IDE integration, UX là first-class.
Triết lý: fully managed — Threads & vector store là server-side.
Triết lý: multi-modal first + 1M context window.
Triết lý: git-native, mỗi action = 1 commit.
Mọi thứ đều có 7 khối — chỉ khác cách triển khai
| Khối | Claude Code | Cursor | OpenAI A. | Gemini | Aider |
|---|---|---|---|---|---|
| Memory file | CLAUDE.md | .cursor/rules | Threads | GEMINI.md | .aider.conf |
| Model mix | ✅ | ✅ | OpenAI only | Google only | ✅ |
| Hooks | ✅ native | Limited | Webhooks | Limited | Git hooks |
| MCP | ✅ | ✅ | ✅ (2025+) | ✅ | Limited |
| UI | Terminal | IDE | API only | Terminal | Terminal |
Khác sản phẩm khác triết lý — nhưng cùng 7 khối. Hiểu khối thì học bất kỳ sản phẩm nào cũng nhanh.
Đặt câu hỏi cho mỗi khối
Template tham khảo — đặt mọi thứ vào file
Mọi thứ checked-in git để reproducible + team review được.
Mega-prompt agent — 1 prompt to dài làm tất cả. Khó debug, dễ drift.
1 model lo tất — Opus cho cả task nhỏ → cost x10.
Bật hết MCP — 20 servers × 50 tools = ngạt context, model bối rối.
Tool xả raw — bash trả 10k dòng → context vỡ.
Không stop condition — agent loop vô tận, tốn tiền.
Không log trace — bug xảy ra → bó tay debug.
Tách Plan agent + Execute agent; mỗi phần ngắn, rõ vai.
Trộn model theo task — Opus cho plan, Sonnet cho act, Haiku cho scan.
MCP theo profile (dev / debug / docs); on-demand load.
Tool có output schema + truncate; tóm tắt trước khi feed.
Max steps + token budget + signal "done" rõ ràng.
Tracing (LangSmith/Langfuse) ngay từ ngày 1.
Mọi agent đều là biến thể của 7 khối hub-and-spoke: Reasoning · Perception · Planning · Memory · Tools · Comm · Guardrails.
Reasoning là cốt — nhưng 50% chất lượng nằm ở thiết kế Tool. Tool xấu = agent dở dù model giỏi.
Mix models theo vai trò (Plan/Act/Scan/Eval) — tiết kiệm 3–10x cost mà chất lượng tốt hơn.
Claude Code · Cursor · OpenAI · Gemini · Aider khác triết lý nhưng cùng 7 khối. Hiểu khối → học cái nào cũng nhanh.
Guardrails & observability từ ngày 1 — không phải bài tập về nhà sau khi vào prod.
Buổi 4 — Kiến trúc Agentic (Multi-agent)
Khi 1 agent không đủ: Orchestrator, Workers, A2A, shared state.