全景内容结构
整个教程分五个部分、十六章,外加十个补充章节,内容量相当扎实。
基础篇(第 1-3 章):把地基打牢
前三章不讲代码,讲"为什么"。从智能体的定义和历史讲起,把从符号主义到 LLM 驱动的 Agent 演进线理清楚。第三章切入 Transformer 和 Prompt Engineering,为后续动手做铺垫。这个安排很聪明——太多教程一上来就给代码,读者跑通了却不知道自己在干什么。
构建篇(第 4-7 章):从范式到框架到自研
这是全教程的核心区间。第四章是精华——三种经典 Agent 范式的动手实现:ReAct(推理+行动循环)、Plan-and-Solve(先规划再执行)、Reflection(自我反思改进)。不是讲概念,是带你在 OpenAI 原生 API 上一行一行写出来。
第五章转向低代码平台(Coze、Dify、n8n),但定位很清晰:这是"流程驱动的软件工程类 Agent",和 AI Native Agent 有本质区别。第六章带练 AutoGen、AgentScope、LangGraph 三大框架,第七章要求你从零构建自己的 Agent 框架。从"用别人的"到"造自己的",这个递进节奏是整个教程最成功的设计。
前言项目背景、读者指引、学习建议Done
第 1 章智能体概论:定义、类型、范式、应用场景Done
第 2 章发展简史:从符号主义到 LLM 驱动的 AgentDone
第 3 章LLM 基础:Transformer、Prompt Engineering、主流模型Done
第 4 章经典 Agent 范式:ReAct / Plan-and-Solve / ReflectionDone
第 5 章低代码平台实战:Coze / Dify / n8nDone
第 6 章框架开发实践:AutoGen / AgentScope / LangGraphDone
第 7 章从零构建 Agent 框架(HelloAgents)Done
第 8 章记忆与检索:记忆系统 / RAG / 向量存储Done
第 9 章上下文工程:持续交互中的"情境理解"Done
第 10 章Agent 通信协议:MCP / A2A / ANPDone
第 11 章Agentic RL:从 SFT 到 GRPO 的训练流程Done
第 12 章Agent 性能评估:指标 / Benchmark / 评估框架Done
第 13 章智能旅行助手:MCP + 多 Agent 协作Done
第 14 章自动化深度研究 Agent(DeepResearch 复现)Done
第 15 章构建赛博小镇:多 Agent 交互与社会涌现Done
第 16 章Capstone:独立构建完整的多 Agent 应用Done
高级篇(第 8-12 章):记忆、协议、训练、评估
后半程密度明显上升。第十章覆盖 Agent 通信协议三件套——MCP(Anthropic 主导)、A2A(Google 推出)、ANP——在 2026 年初爆发式增长,教程能及时跟进说明维护节奏跟得上。第十一章讲 Agentic RL,从 SFT 到 GRPO 的完整训练流程,在同类教程中极其罕见。
实战篇(第 13-15 章):三个综合案例
智能旅行助手(工具调用型)、DeepResearch Agent(研究型)、赛博小镇(社会仿真型),覆盖当前 Agent 应用的三个主要方向。每个案例都有完整可运行的代码。
值得一提的是补充章节,包含 Agent 面试题、Dify 实战、GUI Agent 基础、技能编写指南、应用开发踩坑经验等十个主题,相当于官方认可的"社区扩展包"。
代码示例
ReAct 范式:推理与行动的循环
第四章的 ReAct 实现是整个教程最核心的代码。Agent 在"思考→行动→观察"的循环中逐步逼近答案:
import openai
client = openai.OpenAI()
SYSTEM_PROMPT = """你是一个能使用工具的助手。
思考过程:
1. Thought: 分析用户问题,决定下一步
2. Action: 调用合适的工具
3. Observation: 观察工具返回结果
4. 循环直到得出最终答案
"""
def react_loop(question, max_steps=5):
messages = [
{"role": "system", "content": SYSTEM_PROMPT},
{"role": "user", "content": question}
]
for step in range(max_steps):
response = client.chat.completions.create(
model="gpt-4o",
messages=messages,
tools=available_tools
)
msg = response.choices[0].message
if msg.content:
return msg.content
if msg.tool_calls:
for tool_call in msg.tool_calls:
result = execute_tool(tool_call)
messages.append({
"role": "tool",
"tool_call_id": tool_call.id,
"content": str(result)
})
messages.append(msg)
return "达到最大步数限制,无法完成"
HelloAgents 框架核心架构
第七章的自研框架把 Agent 抽象为极简的结构——记忆、上下文、工具调用三层:
class Agent:
def __init__(self, name, system_prompt, tools=None):
self.name = name
self.system_prompt = system_prompt
self.tools = tools or []
self.memory = []
def think(self, user_input):
context = self._build_context(user_input)
response = call_llm(context, tools=self.tools)
self.memory.append(response)
return response
def _build_context(self, user_input):
return format_context(
self.system_prompt, self.memory, user_input
)