GitHub AI 深度评测 | Hermes Agent — 128K Stars 的自我进化 AI 智能体

项目概览

Hermes Agent 是 Nous Research（这个团队做过不少出名的开源 LLM 模型）在 2025 年 7 月启动、2026 年 2 月正式走向大众视野的项目。它的目标直指一个很实际的问题：现有的 AI Agent 都是一次性的——关掉终端，记忆就没了。下一个对话又得从头解释自己是谁、在做什么、偏好什么。

Hermes 的回答是：让 Agent 真正"住"下来。部署在你的 VPS 或 Docker 里，跑着一套完整的学习循环——每次对话后自动反思、沉淀技能、更新记忆。下次启动的时候，它比上次更了解你。

到 2026 年 5 月初，它已经积累了 128,306 颗 Stars 和 19,310 个 Fork，是整个 AI Agent 赛道中增长最快的项目之一。v0.12.0（2026.4.30）一个版本就带来了 1,096 次提交、550 个 PR、217 社区贡献者——这个迭代速度已经超过了绝大多数商业产品。

项目名称

NousResearch / hermes-agent

Stars

128,306

Forks

19,310

创建时间

2025-07-22

为什么值得关注

2025 年底到 2026 年初，AI Agent 赛道涌入大量项目。OpenClaw 以"配置即行为"的理念拿了 36 万+ Stars，Claude Code 靠 Anthropic 的模型能力占据了开发者日常编码场景。但这两个项目有一个共同的局限：对话结束即遗忘。Claude Code 依赖 CLAUDE.md 手动维护上下文，OpenClaw 的记忆需要用户自己编排。

Hermes 走了一条不同的路——它不要求用户手动管理记忆，而是把"学习"做进了 Agent 的运行循环里。每次对话结束后，一个后台 fork 会自动分析这次交互，判断需要保存什么记忆、创建什么技能、更新什么知识。用户什么都不用做，Agent 自己就变强了。

这不是噱头。v0.12.0 引入的 Curator 系统已经能自主管理整个技能库——定期评分、合并相关技能、清理过时内容、生成运行报告。Agent 在维护自己的同时也在进化自己。

另一个值得关注的维度是部署成本。Claude Code 按订阅计费，OpenClaw 免费但需要本地运行。Hermes 部署在 $5/月的 VPS 上就能跑，支持 Docker 和 Serverless（Modal/Daytona），空闲时几乎不花一分钱。这对个人开发者和小团队来说是非常友好的定价模型。

核心功能拆解

自我进化的学习闭环

Hermes 的核心卖点，一个字总结就是"长"。长期记忆、长期进化、长期运行。具体来说，这个学习闭环包含几个环节：

1
自动记忆沉淀 — 每次对话结束，后台 fork 分析交互内容，将有价值的信息写入持久记忆。不需要用户告诉它"记住这个"。
2
技能自动创建 — 当 Agent 完成一项复杂的多步骤任务后，它会自动生成一个可复用的 Skill 文件。下次遇到类似任务直接调用，不用从头摸索。
3
使用中自我改进 — 已有的 Skill 不是静态的。Agent 在使用过程中会不断修正和优化技能描述、步骤和参数。
4
定期记忆整理 — Curator 系统按周期（默认 7 天）自动评估记忆和技能的质量，合并重复项、清理过时内容。
5
跨会话检索 — 基于 FTS5 全文搜索，配合 LLM 摘要，可以在历史对话中快速找到相关上下文。

六大终端后端

Hermes 不绑定你的笔记本。它可以在六种环境中运行，根据需求自由切换：

后端	适用场景	特点
Local	日常开发、个人使用	直接使用本机终端，零配置
Docker	隔离环境、安全沙箱	容器化部署，只读根文件系统+权限降级
SSH	远程服务器	连接任意 SSH 主机执行命令
Daytona	Serverless 开发环境	空闲时自动休眠，唤醒时恢复状态
Modal	Serverless GPU 计算	按需启动，按秒计费，适合 GPU 密集任务
Singularity	HPC 超算集群	面向科研场景的高性能计算后端

Daytona 和 Modal 这两个 Serverless 后端尤其值得一提。Agent 的运行环境在空闲时休眠，收到消息或定时任务触发时自动唤醒——这意味着你可以在一台 $5/月的 VPS 上跑一个"常驻"的 AI 助手，但只在它真正工作时才消耗资源。

多平台消息网关

一条 hermes gateway 命令，Agent 就同时接入 Telegram、Discord、Slack、WhatsApp、Signal 以及 Email 等平台。你在手机 Telegram 上发消息，Agent 在云端 VPS 上处理，处理完推送到你的 Discord 频道——对话在不同平台间无缝切换。

v0.12.0 又加入了 Teams 插件支持，加上之前已有的 18 个平台，Hermes 现在覆盖了几乎所有主流即时通讯工具。还内置了 Spotify 和 Google Meet 集成——这不是一个只会聊天的 Agent，它能直接操作你的服务。

40+ 内置工具与 MCP 生态

除了标准文件读写、命令执行、代码编辑之外，Hermes 内置了浏览器自动化、Web 搜索、图像生成、TTS 语音合成、GitHub 集成、图表绘制等 40+ 工具。更关键的是它支持 MCP（Model Context Protocol），可以连接任意 MCP 服务器扩展能力边界。ComfyUI 和 TouchDesigner 在 v0.12.0 中从可选变成了默认内置——这是对 AI 创作场景的明显加码。

并行子代理

遇到复杂任务时，Hermes 可以生成隔离的子代理并行处理。每个子代理有自己的对话上下文和终端环境，通过 RPC 通信。这意味着多步骤流水线可以被压缩成"零上下文成本"的并行调用——不需要把所有中间结果塞进主 Agent 的上下文窗口。

Cron 定时任务

内置调度器，用自然语言就能设定定时任务。每天早上推送新闻摘要、每周五做代码审查、每月生成项目报告——全部无人值守执行，结果推送到任意消息平台。和传统 crontab 的区别在于，Hermes 的任务定义是语义化的，Agent 自己理解"每周五下午检查所有未关闭的 Issue"意味着什么。

RL 训练支持

Hermes 不只是一个使用 Agent 的工具，它还是训练下一代 Agent 的研究平台。内置 Atropos RL 环境和批量轨迹生成能力，支持并行生成数千条工具调用轨迹，配合 11 种工具调用解析器，可以针对任意模型架构进行强化学习训练。这意味着你用 Hermes 收集的交互数据，可以直接用来微调更好的 Agent 模型。

技术架构

Hermes 的架构可以用一句话概括：一个持续运行的 Agent 循环 + 六层能力栈。

核心 Agent Loop：接收输入 → LLM 推理 → 工具调用 → 结果反馈 → 记忆/技能更新。这个循环不是一次性的——它挂在网关上持续运行，每次交互都是一次学习机会。

六层能力栈从下往上分别是：

L
LLM 层 — 模型无关的设计。通过 OpenRouter 支持 200+ 模型，也支持 OpenAI、Anthropic、本地 vLLM、NVIDIA NIM 等任意兼容端点。一条 hermes model 命令即时切换，零代码改动。
T
Terminal 层 — 六种终端后端，通过统一抽象层管理。Agent 不关心命令是在本地跑还是在远端 Docker 里跑。
S
Skills 层 — 基于 agentskills.io 开放标准，支持自动创建、使用中改进、社区共享。技能不是代码——是结构化的 Markdown 文件，人工可读可编辑。
M
Memory 层 — 三层记忆系统：短期上下文、中期记忆文件（MEMORY.md + 每日日志）、长期用户建模（基于 Honcho 方言用户模型）。FTS5 全文搜索 + LLM 摘要提供跨会话检索能力。
G
Gateway 层 — 统一消息网关，一个进程接入 18+ 平台。处理消息路由、用户认证、语音转录、跨平台对话连续性。
A
Automation 层 — Cron 调度 + Curator 自管理。定时任务无人值守，技能库自动维护。

v0.12.0 的自我改进循环做了架构级重构：从自由格式的 fork 改为基于评分标准的 class-first 模式，优先更新 Agent 刚刚加载的技能（active-update biased），正确继承父 Agent 的运行时环境（provider、model、credentials 全部透传）。后台 fork 被限制在 memory + skills 两个工具集内，防止能力扩散。每次 fork 处理前还会剔除上一轮的工具消息，确保看到一个干净的上下文。

版本迭代时间线

从 v0.8.0 到 v0.12.0，不到两个月时间，Hermes 完成了从"能用"到"好用到惊人"的跃迁：

v0.8.0 2026-04-08

"智能版"发布。后台任务自动通知、Nous Portal 免费提供 MiMo v2 Pro、跨平台实时模型切换、Honcho 方言用户建模集成。

v0.9.0 2026-04-13

TUI 终端界面全面重写。多行编辑、斜杠命令自动补全、会话历史、中断重定向、流式工具输出。487 commits，63 人参与。

v0.10.0 2026-04-16

"工具网关版"。付费 Nous Portal 用户可使用 Web 搜索、图像生成、TTS、浏览器自动化等工具。

v0.11.0 2026-04-23

"界面版"——里程碑式重构。1,556 commits，761 个 PR，29 人核心 + 290 社区贡献者。全面重构用户界面和交互体验。

v0.12.0 2026-04-30

"策展人版"。自主 Curator 管理技能库，自我改进循环大幅升级，4 个新推理提供商，第 18 个消息平台 + Teams 插件，ComfyUI/TouchDesigner 默认内置。1,096 commits，213 社区贡献者。

安装与上手

安装过程简单到有点不像一个功能这么复杂的项目：

# 一键安装（Linux / macOS / WSL2）
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

# 重载 Shell 环境
source ~/.bashrc

# 启动对话
hermes

安装脚本会自动处理 Python 环境、依赖安装等所有前置步骤。Android 通过 Termux 也能跑。

安装完成后，常用命令：

# 选择模型提供商和具体模型
hermes model

# 配置启用的工具
hermes tools

# 启动消息网关（接入 Telegram / Discord 等）
hermes gateway setup
hermes gateway start

# 从 OpenClaw 迁移数据
hermes claw migrate

# 更新到最新版
hermes update

# 诊断问题
hermes doctor

从 OpenClaw 迁移也很方便——hermes claw migrate 会自动导入 SOUL.md、记忆、技能、API 密钥和消息平台配置，基本可以做到无痛切换。

与同类项目对比

AI Agent 赛道目前三足鼎立：Claude Code 主打交互式编码，OpenClaw 主打配置化行为定义，Hermes 主打自主进化。它们不是互相替代的关系，而是覆盖了三种截然不同的工作流需求。

维度	Hermes Agent	OpenClaw	Claude Code
核心定位	自主进化 Agent	配置即行为	交互式编码助手
Stars	128.3K	366.7K	商业产品
开源协议	MIT	MIT	闭源
运行模式	7×24 后台常驻	按需使用	按需使用
记忆机制	三层自动学习	多层手动管理	CLAUDE.md + 自动
技能来源	自动创建 + 社区 Hub	ClawHub (5700+)	手动安装
消息平台	18+ 原生支持	多平台原生	仅 CLI
定时任务	内置 Cron	内置 Cron	无
部署方式	VPS / Docker / Serverless	本地 CLI	本地 CLI
部署成本	$5/月起	免费 + API 费	订阅制
子代理/并行	支持	支持	不支持
RL 训练	内置 Atropos	无	无
终端后端	6 种	本地	本地

选择建议：需要实时交互写代码 → Claude Code。需要透明可审计的团队标准 Agent → OpenClaw。需要 7×24 无人值守、会自己进步的长期 Agent → Hermes。三者可以组合使用——比如 Claude Code 写代码，Hermes 自动审查 PR 和生成报告。

适用场景与局限性

适用场景

个人知识助手——越用越懂你，跨会话记忆积累
7×24 代码审查——Cron + GitHub MCP 自动跑
社区/客服机器人——原生接入 18+ 平台
定时报告生成——每日摘要、每周审计等无人值守任务
AI 研究平台——批量轨迹生成 + RL 训练
多 Agent 编排——并行子代理处理复杂流水线
低成本长期部署——$5 VPS + Serverless 休眠

局限性

实时交互体验不如 Claude Code 流畅
不适合需要即时人类判断的快节奏编码任务
初始部署有一定学习曲线（网关配置、后端选择）
不支持原生 Windows，需走 WSL2
7,578 个 Open Issues 说明用户量大了之后维护压力不小
自动技能创建的质量依赖底层模型能力
多平台网关的安全性需要用户自行把控

综合评价

Hermes Agent 不是一个"又一个聊天机器人"。它回答了一个很多团队都在尝试但没做好的问题：怎么让 AI Agent 真正拥有持续性。不是靠人工维护的上下文文件，不是靠每次对话前粘贴系统提示，而是把学习和进化做进了运行时。

128K Stars 背后是实打实的产品力：两周一个版本、每次都是数百 commits 量级的功能迭代，社区贡献者从个位数增长到 200+。Curator 系统的引入让"Agent 自我管理"从一个概念变成了可运行的功能。Serverless 后端的整合则解决了"长期运行 Agent"最现实的成本问题。

如果说 2025 年是 AI Agent 的概念验证年，2026 年上半年是"谁能真的跑起来"的工程化年，那 Hermes 可能是目前最接近"跑起来"这个标准的开源方案。它不是某个大厂的实验项目，而是一个活着的、在进化的生态系统。

创新性

9.5

工程完成度

9.3

社区活跃度

9.5

文档质量

8.8

上手难度

8.5

长期价值

9.6

参考链接

GitHub 仓库 — NousResearch/hermes-agent 官方文档 Discord 社区 Skills Hub — agentskills.io Nous Research 官网版本发布记录 Nous Portal — 模型服务

Hermes Agent — 会自己进化的 AI 智能体