🔥 今日 #1 AI Agent MIT 开源自进化

那个"越用越聪明"的 Agent
—— Hermes Agent 深度评测

NousResearch 打造的开源自进化 AI 智能体，今日单日新增 6,438 星，以断层优势登顶 GitHub 热榜第一。它到底做了什么不一样的事？

⭐

61.2k

总 Stars

📈

+6,438

今日新增

🍴

8.2k

Forks

👥

393

贡献者

🔖

v0.8.0

01它是什么，为什么今天这么火

Nous Research 是做大模型微调起家的，Hermes 系列模型在开源社区有不小的名气。但这次 Hermes Agent 走的是另一条路——不是一个模型，而是一个运行在你自己服务器上的 Agent 框架，本质上类似于 Claude Code 或 OpenDevin，但从一开始就把"学习"这件事内置进去了。

项目今年 2 月上线，三个月积累 61k Star，今天单日就新增了 6,438 颗，这个数字放在整个 GitHub 热榜历史上都算得上少见。背后的催化剂大概有两个：一是 v0.8.0 版本昨天刚刚发布，更新幅度较大；二是最近 AI Agent 热度整体走高，Nous Research 的品牌背书又有一定分量。

      Hermes Agent 的差异化定位不是"最强的代码助手"，而是"住在你机器上、记住你工作习惯、还会越来越熟悉你工作方式"的那种 Agent——有点像雇了一个助理，第一天可能还需要解释很多背景，但三个月后他已经知道你不喜欢某些写法、也记得上次那个 API 怎么调的。
    

02核心功能拆解

相比同类框架，Hermes Agent 的功能密度算高的。拆开来看，有几块是真正值得关注的：

🧠

内置学习循环

完成复杂任务后，Agent 会自动提取经验写成可复用的 Skill 文件。这个 Skill 后续还会自我优化，形成正向飞轮。

💾

跨会话记忆

基于 FTS5 全文检索 + LLM 摘要，记住你的偏好、项目上下文和环境配置。数据存本地 ~/.hermes/，不上云。

🔌

模型无关切换

支持 Claude、GPT、GLM、Kimi、MiniMax 等 200+ 模型，通过 /model 命令随时切换，不绑定单一供应商。

📱

多平台消息网关

一个 gateway 进程同时接入 Telegram、Discord、Slack、WhatsApp、Signal。在手机上给 Agent 发条消息，服务器就开始干活了。

⚡

并行子 Agent

复杂任务自动拆解，生成隔离的子 Agent 并行处理，每个子 Agent 有独立对话上下文，主 Agent 不消耗额外 token。

⏰

内置定时调度

用自然语言配置定时任务，比如"每天早上 9 点帮我看一下今日 GitHub 热榜"。不需要额外的 cron 配置。

🔬

RL 训练数据导出

可以把自己 Agent 的执行轨迹导出为 ShareGPT 格式，用于微调私有模型。对自建 AI 基础设施的团队来说是个独特的能力。

🌍

六种执行后端

本地终端、Docker 容器、SSH 远程、Daytona、Singularity、Modal 云端，都可以作为 Agent 的执行环境。

03技术架构：六层分工

从代码结构来看，项目设计得比较清晰，主要分六层：

💻

执行层

本地
Docker
SSH
Modal

🤖

模型路由

Nous Portal
OpenRouter
vLLM
自定义端点

🎯

技能系统

40+ 内置技能
自动创建
agentskills.io
社区扩展

📡

消息网关

Telegram
Discord / Slack
WhatsApp
Signal

⚙️

调度层

cron 定时器
并行子 Agent
RPC 工具调用
任务拆解

🔬

MLOps

Atropos RL
批量轨迹生成
ShareGPT 导出
模型微调

整个架构里，技能系统（Skills）是核心中的核心。每个 Skill 本质上是一个 Markdown 文件，描述了如何完成某类任务。Agent 在解决问题的过程中，如果遇到没有对应 Skill 的情况，会自动创建一个——这个机制让框架真正做到了"越用越会"而不是每次都从零开始。

      技术栈：Python 94%（主语言），Shell 0.5%，Nix 0.4%。核心依赖包括 MCP（Model Context Protocol）、Honcho（用户建模）、agentskills.io 标准。
    

04安装与快速上手

安装体验是这个项目做得比较好的地方之一，一行命令搞定，不需要手动配置 Python 环境或者依赖：

bash · 快速安装

# 支持 Linux / macOS / WSL2 / Android Termux
# ⚠️ Windows 原生不支持，请使用 WSL2
$ curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

# 安装完成后刷新 shell 环境
$ source ~/.bashrc   # 或 source ~/.zshrc

# 启动交互式 CLI
$ hermes

常用命令的设计也比较直觉，记住这几个基本够用：

bash · 常用命令

hermes              # 进入交互式对话
hermes model        # 选择 LLM 提供商和模型
hermes tools        # 配置启用哪些工具
hermes gateway      # 启动 Telegram/Discord 等消息网关
hermes setup        # 完整初始化向导
hermes update       # 更新到最新版
hermes doctor       # 诊断环境问题

# 对话中的斜杠命令
/new                 # 开启新对话
/model claude:opus  # 切换模型
/retry              # 重试上一轮
/compress           # 压缩上下文（省 token）

开发者如果想从源码跑，也比较标准：

bash · 开发者安装

$ git clone https://github.com/NousResearch/hermes-agent.git
$ cd hermes-agent

# 推荐使用 uv（更快的 Python 包管理工具）
$ curl -LsSf https://astral.sh/uv/install.sh | sh
$ uv venv venv --python 3.11
$ source venv/bin/activate
$ uv pip install -e ".[all,dev]"
$ python -m pytest tests/ -q

05与主流竞品的横向对比

放进 AI Agent 框架的大盘来看，Hermes 的位置大概是这样的：

对比维度	Hermes Agent	Claude Code	OpenDevin	OpenClaw
开源协议	MIT 完全开源	✗ 闭源	✓ Apache 2.0	△ 部分开源
模型选择	200+ 模型，任意切换	仅限 Claude	主流模型	主要 OpenAI
自进化 / 学习	自动创建 + 自我优化 Skills	CLAUDE.md 手动维护	✗ 不支持	✗ 不支持
跨会话记忆	FTS5 + LLM 摘要（强）	有限	有限	基础
消息平台接入	6 个平台统一网关	CLI / IDE	Web UI	CLI
RL 训练数据导出	✓ ShareGPT 格式	✗	✗	✗
执行环境	6 种（本地/Docker/SSH/云端）	本地	Docker 沙盒	本地 / 沙盒
稳定性（当前）	△ v0.8.0，约 780 open issues	✓ 成熟	△ 成长中	△ 一般
GitHub Stars	61.2k	—	~40k	~15k

简单来说：如果你用 Claude Code 只是因为没找到好用的开源替代，Hermes 值得认真试一试。如果你的核心诉求是最强的代码能力，那它的上限还是取决于你接入了什么模型——框架本身不提供模型，这点需要有心理预期。

06谁适合用，谁不适合

✅ 适合这几类人

想要完全开源方案的开发者：不想被 Anthropic 或 OpenAI 的服务条款、价格、API 限制绑定，Hermes + 本地或 OpenRouter 模型的组合可以做到零供应商依赖。

需要远程控制服务器的运维：把 Hermes 部署在 VPS 上，配上 Telegram 网关，手机上发一条消息就能远程执行命令、查看日志、部署代码，体验上比 SSH 连接方便不少。

想积累训练数据的 AI 研究者：如果你在构建自己的小模型，用 Hermes 跑任务的同时可以自动积累高质量的工具调用轨迹，省去了单独标注的成本。

重度依赖多个 IM 平台的团队：不同成员用不同的通信工具，Hermes 的统一网关能帮你把 Agent 接入所有平台，不用为每个平台单独部署一套。

⚠️ 需要注意的局限

编程能力上限不固定：框架本身不提供模型，实际代码能力完全取决于你接入了什么 LLM。用 Claude Opus 驱动效果好，用小模型效果会打折扣。

版本还早期，约 780 个 open issues：v0.8.0 刚发布，生产环境需要做好心理预期，遇到 bug 的概率比成熟项目高。

不支持 Windows 原生：必须走 WSL2，对纯 Windows 开发者是一道门槛。

Skills Hub 生态还薄：社区技能库的规模目前还不能和成熟商业产品比，部分垂直场景的技能需要自己写。

07综合结论

编辑结论

Hermes Agent 解决的问题是真实的：大部分 AI Agent 工具用完一次就像失忆了，下次还得重新介绍背景，这让"AI 助理"这个概念始终停留在工具层面而不是协作层面。把学习循环内置进框架，是思路上的进步，执行上也做得相当扎实。

6,438 的单日增长不全是噪音——v0.8.0 的更新内容确实够扎实，加上 Nous Research 在开源 LLM 圈的口碑，这波热度有一定基本面支撑。但 780 个 open issues 也是真实存在的，适合喜欢在早期参与的工程师，不适合直接上生产。

如果你目前在用 Claude Code 并且觉得"不记得我"是最大的痛点，Hermes 的自进化特性正对这个需求；如果你更在意稳定性，再等半年可能是更好的时机。

那个"越用越聪明"的 Agent—— Hermes Agent 深度评测