Hello-Agents 深度评测

项目名片

项目名称

Hello-Agents：从零开始构建智能体

组织

Datawhale China

GitHub

datawhalechina/hello-agents

Star / Fork

45,684 / 5,531

主语言

Python 72.5%Jupyter 12.7%

协议

CC BY-NC-SA 4.0

创建 / Release

2025-09-07 / V1.0.2（2026-02-10）

Open Issues

111

一个开源社区项目，凭什么在不到 8 个月内拿下 4.6 万颗 Star？又凭什么在 GitHub Trending 日榜上以 1,197 颗新增 Star 登顶 AI 教程类第一？

一句话概括：Hello-Agents 教你从零开始，亲手造一个能自主思考、记忆、协作的 AI 智能体系统。不是调 API，不是配 Coze 工作流，是从 Transformer 到 ReAct 到多 Agent 协作的完整链路。

项目发起人陈思州在前言里写得直白——"当前生态存在一个明显断层：一方面是层出不穷的 Agent 框架，令人眼花缭乱；另一方面是系统性知识的极度匮乏。"这句话精准切中了 2025-2026 年 Agent 元年的痛点。Hello-Agents 要做的，就是把积木盒子打开，让你理解每一块积木的材质和结构。

全景内容结构

整个教程分五个部分、十六章，外加十个补充章节，内容量相当扎实。

基础篇（第 1-3 章）：把地基打牢

前三章不讲代码，讲"为什么"。从智能体的定义和历史讲起，把从符号主义到 LLM 驱动的 Agent 演进线理清楚。第三章切入 Transformer 和 Prompt Engineering，为后续动手做铺垫。这个安排很聪明——太多教程一上来就给代码，读者跑通了却不知道自己在干什么。

构建篇（第 4-7 章）：从范式到框架到自研

这是全教程的核心区间。第四章是精华——三种经典 Agent 范式的动手实现：ReAct（推理+行动循环）、Plan-and-Solve（先规划再执行）、Reflection（自我反思改进）。不是讲概念，是带你在 OpenAI 原生 API 上一行一行写出来。

第五章转向低代码平台（Coze、Dify、n8n），但定位很清晰：这是"流程驱动的软件工程类 Agent"，和 AI Native Agent 有本质区别。第六章带练 AutoGen、AgentScope、LangGraph 三大框架，第七章要求你从零构建自己的 Agent 框架。从"用别人的"到"造自己的"，这个递进节奏是整个教程最成功的设计。

第一部分 · 基础篇

前言项目背景、读者指引、学习建议Done

第 1 章智能体概论：定义、类型、范式、应用场景Done

第 2 章发展简史：从符号主义到 LLM 驱动的 AgentDone

第 3 章LLM 基础：Transformer、Prompt Engineering、主流模型Done

第二部分 · 构建篇

第 4 章经典 Agent 范式：ReAct / Plan-and-Solve / ReflectionDone

第 5 章低代码平台实战：Coze / Dify / n8nDone

第 6 章框架开发实践：AutoGen / AgentScope / LangGraphDone

第 7 章从零构建 Agent 框架（HelloAgents）Done

第三部分 · 高级篇

第 8 章记忆与检索：记忆系统 / RAG / 向量存储Done

第 9 章上下文工程：持续交互中的"情境理解"Done

第 10 章Agent 通信协议：MCP / A2A / ANPDone

第 11 章Agentic RL：从 SFT 到 GRPO 的训练流程Done

第 12 章Agent 性能评估：指标 / Benchmark / 评估框架Done

第四部分 · 实战篇

第 13 章智能旅行助手：MCP + 多 Agent 协作Done

第 14 章自动化深度研究 Agent（DeepResearch 复现）Done

第 15 章构建赛博小镇：多 Agent 交互与社会涌现Done

第五部分 · 毕业设计

第 16 章Capstone：独立构建完整的多 Agent 应用Done

高级篇（第 8-12 章）：记忆、协议、训练、评估

后半程密度明显上升。第十章覆盖 Agent 通信协议三件套——MCP（Anthropic 主导）、A2A（Google 推出）、ANP——在 2026 年初爆发式增长，教程能及时跟进说明维护节奏跟得上。第十一章讲 Agentic RL，从 SFT 到 GRPO 的完整训练流程，在同类教程中极其罕见。

实战篇（第 13-15 章）：三个综合案例

智能旅行助手（工具调用型）、DeepResearch Agent（研究型）、赛博小镇（社会仿真型），覆盖当前 Agent 应用的三个主要方向。每个案例都有完整可运行的代码。

值得一提的是补充章节，包含 Agent 面试题、Dify 实战、GUI Agent 基础、技能编写指南、应用开发踩坑经验等十个主题，相当于官方认可的"社区扩展包"。

技术栈一览

Python 72.5% Jupyter Notebook 12.7% Vue 6.2% HTML/JS/CSS

OpenAI API DeepSeek / Qwen Coze / Dify / n8n AutoGen AgentScope LangGraph MCP / A2A / ANP SFT / GRPO

技术选型相当务实。LLM API 以 OpenAI 为基准，同时兼容 DeepSeek、Qwen 等国产模型。低代码平台覆盖国内最常用的 Coze 和 Dify，框架覆盖三大主流方案。自研框架 HelloAgents 基于原生 OpenAI API，不依赖任何第三方框架。

代码示例

ReAct 范式：推理与行动的循环

第四章的 ReAct 实现是整个教程最核心的代码。Agent 在"思考→行动→观察"的循环中逐步逼近答案：

chapter4/react_agent.py Python

import openai

client = openai.OpenAI()

SYSTEM_PROMPT = """你是一个能使用工具的助手。
思考过程：
1. Thought: 分析用户问题，决定下一步
2. Action: 调用合适的工具
3. Observation: 观察工具返回结果
4. 循环直到得出最终答案
"""

def react_loop(question, max_steps=5):
    messages = [
        {"role": "system", "content": SYSTEM_PROMPT},
        {"role": "user", "content": question}
    ]

    for step in range(max_steps):
        response = client.chat.completions.create(
            model="gpt-4o",
            messages=messages,
            tools=available_tools
        )

        msg = response.choices[0].message

        if msg.content:  # Agent 认为可以给出最终答案
            return msg.content

        if msg.tool_calls:  # Agent 决定调用工具
            for tool_call in msg.tool_calls:
                result = execute_tool(tool_call)
                messages.append({
                    "role": "tool",
                    "tool_call_id": tool_call.id,
                    "content": str(result)
                })
            messages.append(msg)

    return "达到最大步数限制，无法完成"

HelloAgents 框架核心架构

第七章的自研框架把 Agent 抽象为极简的结构——记忆、上下文、工具调用三层：

chapter7/helloagents/core.py Python

class Agent:
    def __init__(self, name, system_prompt, tools=None):
        self.name = name
        self.system_prompt = system_prompt
        self.tools = tools or []
        self.memory = []

    def think(self, user_input):
        # 将记忆 + 输入构建为完整上下文
        context = self._build_context(user_input)
        response = call_llm(context, tools=self.tools)
        self.memory.append(response)
        return response

    def _build_context(self, user_input):
        # 上下文工程：截取相关记忆片段
        return format_context(
            self.system_prompt, self.memory, user_input
        )

竞品对比

在中文 AI 教程赛道上，Hello-Agents 和 dive-into-llms 是两座最高峰，但定位差异明显：

维度	Hello-Agents	动手学大模型	LangChain 官方	DeepLearning.AI
定位	Agent 系统构建全链路	大模型编程实践（偏安全）	框架使用指南	产业化短课程
Star	45.7K	36.5K	N/A	N/A
章节数	16 + 10 补充	11	按主题分散	按课程分散
语言	中文为主	中文为主	英文	英文
理论深度	高（第一性原理）	中高（上交大体系）	中	中
Agent 专项	核心主题	仅 1 章	核心主题	部分课程
模型训练	有（Agentic RL）	有（微调+RLHF）	无	部分
协议覆盖	MCP/A2A/ANP	无	MCP	无
多 Agent 协作	完整章节	无	有（LangGraph）	部分
价格	免费	免费	免费	付费

dive-into-llms 偏大模型底层（微调、水印、越狱、RLHF），Agent 只占一章；Hello-Agents 则把 Agent 作为绝对核心，从原理到框架到自研到多 Agent 协作，一条线打穿。两者定位互补而非竞争——理想的学习路径是先读 Hello-Agents 学会造 Agent，再用 dive-into-llms 补大模型底层知识。

社区热度分析

45,684 颗 Star 对一个不到一年的教育类开源项目来说，是一个非常夸张的数字。作为参考：Andrew Ng 的 Machine Learning Specialization 在 Coursera 上有数百万注册，但对应的开源仓库 Star 通常不超过 5K。LangChain 官方仓库本身 100K+ Star，但那是工业级框架，不是教程。纯教育类项目能拿到 40K+ Star 的，在 GitHub 历史上屈指可数。

2025 年 9 月创建，2026 年 2 月发布 V1.0.2，5 月日增 1,197 Star，增长曲线几乎是教科书级别的开源项目爆发路径。

5,531 个 Fork 和 111 个 Open Issues，Fork-to-Issue 比约 50:1，说明大部分 Fork 是"收藏"行为。这对教程类项目来说很正常——毕竟你很难给一本教材提 PR。

适合谁，不适合谁

适合

有 Python 基础、用过 ChatGPT API 的工程师
在用 Dify/Coze 但觉得"卡在模板里"的人
需要面试 Agent 相关岗位的求职者
想从 LLM 使用者转型为 Agent 构建者的开发者
做毕业设计需要 Agent 方向的在校学生

不太适合

完全没有编程经验的零基础用户
只想快速搭建 Chatbot 的非技术人员
已是资深 Agent 工程师，找论文复现
需要英文环境、国际化认证的学习者

综合评分

9.5

内容系统性

9.0

实践性

9.0

中文质量

8.5

内容时效性

8.5

技术深度

8.0

社区活跃度

7.5

可维护性

综合评分

8.6 / 10

写在最后

2025 年被很多人称为"Agent 元年"，但到了 2026 年中，真正理解 Agent 底层原理的人依然稀缺。大多数从业者停留在"调 API + 拼工作流"的阶段，面对复杂需求时捉襟见肘。

Hello-Agents 的价值不在于它教了多少框架，而在于它教你怎么理解框架——从 ReAct 的思考循环到 MCP 的通信机制到 GRPO 的训练流程，它把 Agent 的"黑盒"一层一层拆开，让你看到里面的齿轮和弹簧。

对于一个完全免费、社区驱动的中文开源项目来说，做到这个程度已经相当 impressive。如果你正在考虑系统学习 Agent 开发，这大概率是目前中文世界里最值得投入时间的起点。

项目名片

全景内容结构

基础篇（第 1-3 章）：把地基打牢

构建篇（第 4-7 章）：从范式到框架到自研

高级篇（第 8-12 章）：记忆、协议、训练、评估

实战篇（第 13-15 章）：三个综合案例

技术栈一览

代码示例

ReAct 范式：推理与行动的循环

HelloAgents 框架核心架构

竞品对比

社区热度分析

适合谁，不适合谁

适合

不太适合

综合评分

写在最后

参考链接