🔥 今日 #1 AI Agent MIT 开源 自进化

那个"越用越聪明"的 Agent
—— Hermes Agent 深度评测

NousResearch 打造的开源自进化 AI 智能体,今日单日新增 6,438 星,以断层优势登顶 GitHub 热榜第一。它到底做了什么不一样的事?

61.2k
总 Stars
📈
+6,438
今日新增
🍴
8.2k
Forks
👥
393
贡献者
🔖
v0.8.0
最新版本
9.2
功能完整度
8.5
易用性
9.5
扩展性
7.8
稳定性
9.0
社区活跃度
综合评分(满分 10) 8.8 / 10

01它是什么,为什么今天这么火

Nous Research 是做大模型微调起家的,Hermes 系列模型在开源社区有不小的名气。但这次 Hermes Agent 走的是另一条路——不是一个模型,而是一个运行在你自己服务器上的 Agent 框架,本质上类似于 Claude Code 或 OpenDevin,但从一开始就把"学习"这件事内置进去了。

项目今年 2 月上线,三个月积累 61k Star,今天单日就新增了 6,438 颗,这个数字放在整个 GitHub 热榜历史上都算得上少见。背后的催化剂大概有两个:一是 v0.8.0 版本昨天刚刚发布,更新幅度较大;二是最近 AI Agent 热度整体走高,Nous Research 的品牌背书又有一定分量。

Hermes Agent 的差异化定位不是"最强的代码助手",而是"住在你机器上、记住你工作习惯、还会越来越熟悉你工作方式"的那种 Agent——有点像雇了一个助理,第一天可能还需要解释很多背景,但三个月后他已经知道你不喜欢某些写法、也记得上次那个 API 怎么调的。

02核心功能拆解

相比同类框架,Hermes Agent 的功能密度算高的。拆开来看,有几块是真正值得关注的:

🧠
内置学习循环
完成复杂任务后,Agent 会自动提取经验写成可复用的 Skill 文件。这个 Skill 后续还会自我优化,形成正向飞轮。
💾
跨会话记忆
基于 FTS5 全文检索 + LLM 摘要,记住你的偏好、项目上下文和环境配置。数据存本地 ~/.hermes/,不上云。
🔌
模型无关切换
支持 Claude、GPT、GLM、Kimi、MiniMax 等 200+ 模型,通过 /model 命令随时切换,不绑定单一供应商。
📱
多平台消息网关
一个 gateway 进程同时接入 Telegram、Discord、Slack、WhatsApp、Signal。在手机上给 Agent 发条消息,服务器就开始干活了。
并行子 Agent
复杂任务自动拆解,生成隔离的子 Agent 并行处理,每个子 Agent 有独立对话上下文,主 Agent 不消耗额外 token。
内置定时调度
用自然语言配置定时任务,比如"每天早上 9 点帮我看一下今日 GitHub 热榜"。不需要额外的 cron 配置。
🔬
RL 训练数据导出
可以把自己 Agent 的执行轨迹导出为 ShareGPT 格式,用于微调私有模型。对自建 AI 基础设施的团队来说是个独特的能力。
🌍
六种执行后端
本地终端、Docker 容器、SSH 远程、Daytona、Singularity、Modal 云端,都可以作为 Agent 的执行环境。

03技术架构:六层分工

从代码结构来看,项目设计得比较清晰,主要分六层:

💻
执行层
本地
Docker
SSH
Modal
🤖
模型路由
Nous Portal
OpenRouter
vLLM
自定义端点
🎯
技能系统
40+ 内置技能
自动创建
agentskills.io
社区扩展
📡
消息网关
Telegram
Discord / Slack
WhatsApp
Signal
⚙️
调度层
cron 定时器
并行子 Agent
RPC 工具调用
任务拆解
🔬
MLOps
Atropos RL
批量轨迹生成
ShareGPT 导出
模型微调

整个架构里,技能系统(Skills)是核心中的核心。每个 Skill 本质上是一个 Markdown 文件,描述了如何完成某类任务。Agent 在解决问题的过程中,如果遇到没有对应 Skill 的情况,会自动创建一个——这个机制让框架真正做到了"越用越会"而不是每次都从零开始。

技术栈:Python 94%(主语言),Shell 0.5%,Nix 0.4%。核心依赖包括 MCP(Model Context Protocol)、Honcho(用户建模)、agentskills.io 标准。

04安装与快速上手

安装体验是这个项目做得比较好的地方之一,一行命令搞定,不需要手动配置 Python 环境或者依赖:

bash · 快速安装
# 支持 Linux / macOS / WSL2 / Android Termux
# ⚠️ Windows 原生不支持,请使用 WSL2
$ curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

# 安装完成后刷新 shell 环境
$ source ~/.bashrc   # 或 source ~/.zshrc

# 启动交互式 CLI
$ hermes

常用命令的设计也比较直觉,记住这几个基本够用:

bash · 常用命令
hermes              # 进入交互式对话
hermes model        # 选择 LLM 提供商和模型
hermes tools        # 配置启用哪些工具
hermes gateway      # 启动 Telegram/Discord 等消息网关
hermes setup        # 完整初始化向导
hermes update       # 更新到最新版
hermes doctor       # 诊断环境问题

# 对话中的斜杠命令
/new                 # 开启新对话
/model claude:opus  # 切换模型
/retry              # 重试上一轮
/compress           # 压缩上下文(省 token)

开发者如果想从源码跑,也比较标准:

bash · 开发者安装
$ git clone https://github.com/NousResearch/hermes-agent.git
$ cd hermes-agent

# 推荐使用 uv(更快的 Python 包管理工具)
$ curl -LsSf https://astral.sh/uv/install.sh | sh
$ uv venv venv --python 3.11
$ source venv/bin/activate
$ uv pip install -e ".[all,dev]"
$ python -m pytest tests/ -q

05与主流竞品的横向对比

放进 AI Agent 框架的大盘来看,Hermes 的位置大概是这样的:

对比维度 Hermes Agent Claude Code OpenDevin OpenClaw
开源协议 MIT 完全开源 闭源 Apache 2.0 部分开源
模型选择 200+ 模型,任意切换 仅限 Claude 主流模型 主要 OpenAI
自进化 / 学习 自动创建 + 自我优化 Skills CLAUDE.md 手动维护 不支持 不支持
跨会话记忆 FTS5 + LLM 摘要(强) 有限 有限 基础
消息平台接入 6 个平台统一网关 CLI / IDE Web UI CLI
RL 训练数据导出 ShareGPT 格式
执行环境 6 种(本地/Docker/SSH/云端) 本地 Docker 沙盒 本地 / 沙盒
稳定性(当前) v0.8.0,约 780 open issues 成熟 成长中 一般
GitHub Stars 61.2k ~40k ~15k

简单来说:如果你用 Claude Code 只是因为没找到好用的开源替代,Hermes 值得认真试一试。如果你的核心诉求是最强的代码能力,那它的上限还是取决于你接入了什么模型——框架本身不提供模型,这点需要有心理预期。

06谁适合用,谁不适合

✅ 适合这几类人

想要完全开源方案的开发者:不想被 Anthropic 或 OpenAI 的服务条款、价格、API 限制绑定,Hermes + 本地或 OpenRouter 模型的组合可以做到零供应商依赖。

需要远程控制服务器的运维:把 Hermes 部署在 VPS 上,配上 Telegram 网关,手机上发一条消息就能远程执行命令、查看日志、部署代码,体验上比 SSH 连接方便不少。

想积累训练数据的 AI 研究者:如果你在构建自己的小模型,用 Hermes 跑任务的同时可以自动积累高质量的工具调用轨迹,省去了单独标注的成本。

重度依赖多个 IM 平台的团队:不同成员用不同的通信工具,Hermes 的统一网关能帮你把 Agent 接入所有平台,不用为每个平台单独部署一套。

⚠️ 需要注意的局限

编程能力上限不固定:框架本身不提供模型,实际代码能力完全取决于你接入了什么 LLM。用 Claude Opus 驱动效果好,用小模型效果会打折扣。

版本还早期,约 780 个 open issues:v0.8.0 刚发布,生产环境需要做好心理预期,遇到 bug 的概率比成熟项目高。

不支持 Windows 原生:必须走 WSL2,对纯 Windows 开发者是一道门槛。

Skills Hub 生态还薄:社区技能库的规模目前还不能和成熟商业产品比,部分垂直场景的技能需要自己写。

07综合结论

编辑结论
Hermes Agent 解决的问题是真实的:大部分 AI Agent 工具用完一次就像失忆了,下次还得重新介绍背景,这让"AI 助理"这个概念始终停留在工具层面而不是协作层面。把学习循环内置进框架,是思路上的进步,执行上也做得相当扎实。

6,438 的单日增长不全是噪音——v0.8.0 的更新内容确实够扎实,加上 Nous Research 在开源 LLM 圈的口碑,这波热度有一定基本面支撑。但 780 个 open issues 也是真实存在的,适合喜欢在早期参与的工程师,不适合直接上生产。

如果你目前在用 Claude Code 并且觉得"不记得我"是最大的痛点,Hermes 的自进化特性正对这个需求;如果你更在意稳定性,再等半年可能是更好的时机。

参考来源与延伸阅读