GitHub AI 项目深度评测 · 2026-05-02

Hermes Agent — 会自己
进化的 AI 智能体

128K Stars,19K Forks。这不是又一个聊天机器人——它部署在你的服务器上,7×24 小时运转,自己创建技能、自己管理记忆、越用越强。从 Telegram 到 Discord,从 Cron 定时任务到并行子代理,一个框架覆盖了 AI Agent 该有的样子。

Hermes Agent Self-Improving Agent Nous Research Multi-Platform Gateway Persistent Memory MIT License
9.2

综合评分

128.3K
Stars
19.3K
Forks
MIT
License
Python
Language

项目概览

Hermes Agent 是 Nous Research(这个团队做过不少出名的开源 LLM 模型)在 2025 年 7 月启动、2026 年 2 月正式走向大众视野的项目。它的目标直指一个很实际的问题:现有的 AI Agent 都是一次性的——关掉终端,记忆就没了。下一个对话又得从头解释自己是谁、在做什么、偏好什么。

Hermes 的回答是:让 Agent 真正"住"下来。部署在你的 VPS 或 Docker 里,跑着一套完整的学习循环——每次对话后自动反思、沉淀技能、更新记忆。下次启动的时候,它比上次更了解你。

到 2026 年 5 月初,它已经积累了 128,306 颗 Stars 和 19,310 个 Fork,是整个 AI Agent 赛道中增长最快的项目之一。v0.12.0(2026.4.30)一个版本就带来了 1,096 次提交、550 个 PR、217 社区贡献者——这个迭代速度已经超过了绝大多数商业产品。

项目名称
NousResearch / hermes-agent
Stars
128,306
Forks
19,310
创建时间
2025-07-22
最近更新
2026-05-02
主要语言
Python
许可证
MIT
Open Issues
7,578
最新版本
v0.12.0 (2026.4.30)
Discord 社区
478 Watchers

为什么值得关注

2025 年底到 2026 年初,AI Agent 赛道涌入大量项目。OpenClaw 以"配置即行为"的理念拿了 36 万+ Stars,Claude Code 靠 Anthropic 的模型能力占据了开发者日常编码场景。但这两个项目有一个共同的局限:对话结束即遗忘。Claude Code 依赖 CLAUDE.md 手动维护上下文,OpenClaw 的记忆需要用户自己编排。

Hermes 走了一条不同的路——它不要求用户手动管理记忆,而是把"学习"做进了 Agent 的运行循环里。每次对话结束后,一个后台 fork 会自动分析这次交互,判断需要保存什么记忆、创建什么技能、更新什么知识。用户什么都不用做,Agent 自己就变强了。

这不是噱头。v0.12.0 引入的 Curator 系统已经能自主管理整个技能库——定期评分、合并相关技能、清理过时内容、生成运行报告。Agent 在维护自己的同时也在进化自己。

另一个值得关注的维度是部署成本。Claude Code 按订阅计费,OpenClaw 免费但需要本地运行。Hermes 部署在 $5/月 的 VPS 上就能跑,支持 Docker 和 Serverless(Modal/Daytona),空闲时几乎不花一分钱。这对个人开发者和小团队来说是非常友好的定价模型。

核心功能拆解

自我进化的学习闭环

Hermes 的核心卖点,一个字总结就是"长"。长期记忆、长期进化、长期运行。具体来说,这个学习闭环包含几个环节:

  • 1
    自动记忆沉淀 — 每次对话结束,后台 fork 分析交互内容,将有价值的信息写入持久记忆。不需要用户告诉它"记住这个"。
  • 2
    技能自动创建 — 当 Agent 完成一项复杂的多步骤任务后,它会自动生成一个可复用的 Skill 文件。下次遇到类似任务直接调用,不用从头摸索。
  • 3
    使用中自我改进 — 已有的 Skill 不是静态的。Agent 在使用过程中会不断修正和优化技能描述、步骤和参数。
  • 4
    定期记忆整理 — Curator 系统按周期(默认 7 天)自动评估记忆和技能的质量,合并重复项、清理过时内容。
  • 5
    跨会话检索 — 基于 FTS5 全文搜索,配合 LLM 摘要,可以在历史对话中快速找到相关上下文。

六大终端后端

Hermes 不绑定你的笔记本。它可以在六种环境中运行,根据需求自由切换:

后端适用场景特点
Local日常开发、个人使用直接使用本机终端,零配置
Docker隔离环境、安全沙箱容器化部署,只读根文件系统+权限降级
SSH远程服务器连接任意 SSH 主机执行命令
DaytonaServerless 开发环境空闲时自动休眠,唤醒时恢复状态
ModalServerless GPU 计算按需启动,按秒计费,适合 GPU 密集任务
SingularityHPC 超算集群面向科研场景的高性能计算后端

Daytona 和 Modal 这两个 Serverless 后端尤其值得一提。Agent 的运行环境在空闲时休眠,收到消息或定时任务触发时自动唤醒——这意味着你可以在一台 $5/月 的 VPS 上跑一个"常驻"的 AI 助手,但只在它真正工作时才消耗资源。

多平台消息网关

一条 hermes gateway 命令,Agent 就同时接入 Telegram、Discord、Slack、WhatsApp、Signal 以及 Email 等平台。你在手机 Telegram 上发消息,Agent 在云端 VPS 上处理,处理完推送到你的 Discord 频道——对话在不同平台间无缝切换。

v0.12.0 又加入了 Teams 插件支持,加上之前已有的 18 个平台,Hermes 现在覆盖了几乎所有主流即时通讯工具。还内置了 Spotify 和 Google Meet 集成——这不是一个只会聊天的 Agent,它能直接操作你的服务。

40+ 内置工具与 MCP 生态

除了标准文件读写、命令执行、代码编辑之外,Hermes 内置了浏览器自动化、Web 搜索、图像生成、TTS 语音合成、GitHub 集成、图表绘制等 40+ 工具。更关键的是它支持 MCP(Model Context Protocol),可以连接任意 MCP 服务器扩展能力边界。ComfyUI 和 TouchDesigner 在 v0.12.0 中从可选变成了默认内置——这是对 AI 创作场景的明显加码。

并行子代理

遇到复杂任务时,Hermes 可以生成隔离的子代理并行处理。每个子代理有自己的对话上下文和终端环境,通过 RPC 通信。这意味着多步骤流水线可以被压缩成"零上下文成本"的并行调用——不需要把所有中间结果塞进主 Agent 的上下文窗口。

Cron 定时任务

内置调度器,用自然语言就能设定定时任务。每天早上推送新闻摘要、每周五做代码审查、每月生成项目报告——全部无人值守执行,结果推送到任意消息平台。和传统 crontab 的区别在于,Hermes 的任务定义是语义化的,Agent 自己理解"每周五下午检查所有未关闭的 Issue"意味着什么。

RL 训练支持

Hermes 不只是一个使用 Agent 的工具,它还是训练下一代 Agent 的研究平台。内置 Atropos RL 环境和批量轨迹生成能力,支持并行生成数千条工具调用轨迹,配合 11 种工具调用解析器,可以针对任意模型架构进行强化学习训练。这意味着你用 Hermes 收集的交互数据,可以直接用来微调更好的 Agent 模型。

技术架构

Hermes 的架构可以用一句话概括:一个持续运行的 Agent 循环 + 六层能力栈

核心 Agent Loop:接收输入 → LLM 推理 → 工具调用 → 结果反馈 → 记忆/技能更新。这个循环不是一次性的——它挂在网关上持续运行,每次交互都是一次学习机会。

六层能力栈从下往上分别是:

  • L
    LLM 层 — 模型无关的设计。通过 OpenRouter 支持 200+ 模型,也支持 OpenAI、Anthropic、本地 vLLM、NVIDIA NIM 等任意兼容端点。一条 hermes model 命令即时切换,零代码改动。
  • T
    Terminal 层 — 六种终端后端,通过统一抽象层管理。Agent 不关心命令是在本地跑还是在远端 Docker 里跑。
  • S
    Skills 层 — 基于 agentskills.io 开放标准,支持自动创建、使用中改进、社区共享。技能不是代码——是结构化的 Markdown 文件,人工可读可编辑。
  • M
    Memory 层 — 三层记忆系统:短期上下文、中期记忆文件(MEMORY.md + 每日日志)、长期用户建模(基于 Honcho 方言用户模型)。FTS5 全文搜索 + LLM 摘要提供跨会话检索能力。
  • G
    Gateway 层 — 统一消息网关,一个进程接入 18+ 平台。处理消息路由、用户认证、语音转录、跨平台对话连续性。
  • A
    Automation 层 — Cron 调度 + Curator 自管理。定时任务无人值守,技能库自动维护。

v0.12.0 的自我改进循环做了架构级重构:从自由格式的 fork 改为基于评分标准的 class-first 模式,优先更新 Agent 刚刚加载的技能(active-update biased),正确继承父 Agent 的运行时环境(provider、model、credentials 全部透传)。后台 fork 被限制在 memory + skills 两个工具集内,防止能力扩散。每次 fork 处理前还会剔除上一轮的工具消息,确保看到一个干净的上下文。

版本迭代时间线

从 v0.8.0 到 v0.12.0,不到两个月时间,Hermes 完成了从"能用"到"好用到惊人"的跃迁:

v0.8.0 2026-04-08
"智能版"发布。后台任务自动通知、Nous Portal 免费提供 MiMo v2 Pro、跨平台实时模型切换、Honcho 方言用户建模集成。
v0.9.0 2026-04-13
TUI 终端界面全面重写。多行编辑、斜杠命令自动补全、会话历史、中断重定向、流式工具输出。487 commits,63 人参与。
v0.10.0 2026-04-16
"工具网关版"。付费 Nous Portal 用户可使用 Web 搜索、图像生成、TTS、浏览器自动化等工具。
v0.11.0 2026-04-23
"界面版"——里程碑式重构。1,556 commits,761 个 PR,29 人核心 + 290 社区贡献者。全面重构用户界面和交互体验。
v0.12.0 2026-04-30
"策展人版"。自主 Curator 管理技能库,自我改进循环大幅升级,4 个新推理提供商,第 18 个消息平台 + Teams 插件,ComfyUI/TouchDesigner 默认内置。1,096 commits,213 社区贡献者。

安装与上手

安装过程简单到有点不像一个功能这么复杂的项目:

# 一键安装(Linux / macOS / WSL2)
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

# 重载 Shell 环境
source ~/.bashrc

# 启动对话
hermes

安装脚本会自动处理 Python 环境、依赖安装等所有前置步骤。Android 通过 Termux 也能跑。

安装完成后,常用命令:

# 选择模型提供商和具体模型
hermes model

# 配置启用的工具
hermes tools

# 启动消息网关(接入 Telegram / Discord 等)
hermes gateway setup
hermes gateway start

# 从 OpenClaw 迁移数据
hermes claw migrate

# 更新到最新版
hermes update

# 诊断问题
hermes doctor

从 OpenClaw 迁移也很方便——hermes claw migrate 会自动导入 SOUL.md、记忆、技能、API 密钥和消息平台配置,基本可以做到无痛切换。

与同类项目对比

AI Agent 赛道目前三足鼎立:Claude Code 主打交互式编码,OpenClaw 主打配置化行为定义,Hermes 主打自主进化。它们不是互相替代的关系,而是覆盖了三种截然不同的工作流需求。

维度Hermes AgentOpenClawClaude Code
核心定位自主进化 Agent配置即行为交互式编码助手
Stars128.3K366.7K商业产品
开源协议MITMIT闭源
运行模式7×24 后台常驻按需使用按需使用
记忆机制三层自动学习多层手动管理CLAUDE.md + 自动
技能来源自动创建 + 社区 HubClawHub (5700+)手动安装
消息平台18+ 原生支持多平台原生仅 CLI
定时任务内置 Cron内置 Cron
部署方式VPS / Docker / Serverless本地 CLI本地 CLI
部署成本$5/月起免费 + API 费订阅制
子代理/并行支持支持不支持
RL 训练内置 Atropos
终端后端6 种本地本地

选择建议:需要实时交互写代码 → Claude Code。需要透明可审计的团队标准 Agent → OpenClaw。需要 7×24 无人值守、会自己进步的长期 Agent → Hermes。三者可以组合使用——比如 Claude Code 写代码,Hermes 自动审查 PR 和生成报告。

适用场景与局限性

适用场景

  • 个人知识助手——越用越懂你,跨会话记忆积累
  • 7×24 代码审查——Cron + GitHub MCP 自动跑
  • 社区/客服机器人——原生接入 18+ 平台
  • 定时报告生成——每日摘要、每周审计等无人值守任务
  • AI 研究平台——批量轨迹生成 + RL 训练
  • 多 Agent 编排——并行子代理处理复杂流水线
  • 低成本长期部署——$5 VPS + Serverless 休眠

局限性

  • 实时交互体验不如 Claude Code 流畅
  • 不适合需要即时人类判断的快节奏编码任务
  • 初始部署有一定学习曲线(网关配置、后端选择)
  • 不支持原生 Windows,需走 WSL2
  • 7,578 个 Open Issues 说明用户量大了之后维护压力不小
  • 自动技能创建的质量依赖底层模型能力
  • 多平台网关的安全性需要用户自行把控

综合评价

Hermes Agent 不是一个"又一个聊天机器人"。它回答了一个很多团队都在尝试但没做好的问题:怎么让 AI Agent 真正拥有持续性。不是靠人工维护的上下文文件,不是靠每次对话前粘贴系统提示,而是把学习和进化做进了运行时。

128K Stars 背后是实打实的产品力:两周一个版本、每次都是数百 commits 量级的功能迭代,社区贡献者从个位数增长到 200+。Curator 系统的引入让"Agent 自我管理"从一个概念变成了可运行的功能。Serverless 后端的整合则解决了"长期运行 Agent"最现实的成本问题。

如果说 2025 年是 AI Agent 的概念验证年,2026 年上半年是"谁能真的跑起来"的工程化年,那 Hermes 可能是目前最接近"跑起来"这个标准的开源方案。它不是某个大厂的实验项目,而是一个活着的、在进化的生态系统。

创新性
9.5
工程完成度
9.3
社区活跃度
9.5
文档质量
8.8
上手难度
8.5
长期价值
9.6