NousResearch 打造的开源自进化 AI 智能体,今日单日新增 6,438 星,以断层优势登顶 GitHub 热榜第一。它到底做了什么不一样的事?
Nous Research 是做大模型微调起家的,Hermes 系列模型在开源社区有不小的名气。但这次 Hermes Agent 走的是另一条路——不是一个模型,而是一个运行在你自己服务器上的 Agent 框架,本质上类似于 Claude Code 或 OpenDevin,但从一开始就把"学习"这件事内置进去了。
项目今年 2 月上线,三个月积累 61k Star,今天单日就新增了 6,438 颗,这个数字放在整个 GitHub 热榜历史上都算得上少见。背后的催化剂大概有两个:一是 v0.8.0 版本昨天刚刚发布,更新幅度较大;二是最近 AI Agent 热度整体走高,Nous Research 的品牌背书又有一定分量。
相比同类框架,Hermes Agent 的功能密度算高的。拆开来看,有几块是真正值得关注的:
~/.hermes/,不上云。/model 命令随时切换,不绑定单一供应商。从代码结构来看,项目设计得比较清晰,主要分六层:
整个架构里,技能系统(Skills)是核心中的核心。每个 Skill 本质上是一个 Markdown 文件,描述了如何完成某类任务。Agent 在解决问题的过程中,如果遇到没有对应 Skill 的情况,会自动创建一个——这个机制让框架真正做到了"越用越会"而不是每次都从零开始。
安装体验是这个项目做得比较好的地方之一,一行命令搞定,不需要手动配置 Python 环境或者依赖:
# 支持 Linux / macOS / WSL2 / Android Termux # ⚠️ Windows 原生不支持,请使用 WSL2 $ curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash # 安装完成后刷新 shell 环境 $ source ~/.bashrc # 或 source ~/.zshrc # 启动交互式 CLI $ hermes
常用命令的设计也比较直觉,记住这几个基本够用:
hermes # 进入交互式对话 hermes model # 选择 LLM 提供商和模型 hermes tools # 配置启用哪些工具 hermes gateway # 启动 Telegram/Discord 等消息网关 hermes setup # 完整初始化向导 hermes update # 更新到最新版 hermes doctor # 诊断环境问题 # 对话中的斜杠命令 /new # 开启新对话 /model claude:opus # 切换模型 /retry # 重试上一轮 /compress # 压缩上下文(省 token)
开发者如果想从源码跑,也比较标准:
$ git clone https://github.com/NousResearch/hermes-agent.git $ cd hermes-agent # 推荐使用 uv(更快的 Python 包管理工具) $ curl -LsSf https://astral.sh/uv/install.sh | sh $ uv venv venv --python 3.11 $ source venv/bin/activate $ uv pip install -e ".[all,dev]" $ python -m pytest tests/ -q
放进 AI Agent 框架的大盘来看,Hermes 的位置大概是这样的:
简单来说:如果你用 Claude Code 只是因为没找到好用的开源替代,Hermes 值得认真试一试。如果你的核心诉求是最强的代码能力,那它的上限还是取决于你接入了什么模型——框架本身不提供模型,这点需要有心理预期。
想要完全开源方案的开发者:不想被 Anthropic 或 OpenAI 的服务条款、价格、API 限制绑定,Hermes + 本地或 OpenRouter 模型的组合可以做到零供应商依赖。
需要远程控制服务器的运维:把 Hermes 部署在 VPS 上,配上 Telegram 网关,手机上发一条消息就能远程执行命令、查看日志、部署代码,体验上比 SSH 连接方便不少。
想积累训练数据的 AI 研究者:如果你在构建自己的小模型,用 Hermes 跑任务的同时可以自动积累高质量的工具调用轨迹,省去了单独标注的成本。
重度依赖多个 IM 平台的团队:不同成员用不同的通信工具,Hermes 的统一网关能帮你把 Agent 接入所有平台,不用为每个平台单独部署一套。
编程能力上限不固定:框架本身不提供模型,实际代码能力完全取决于你接入了什么 LLM。用 Claude Opus 驱动效果好,用小模型效果会打折扣。
版本还早期,约 780 个 open issues:v0.8.0 刚发布,生产环境需要做好心理预期,遇到 bug 的概率比成熟项目高。
不支持 Windows 原生:必须走 WSL2,对纯 Windows 开发者是一道门槛。
Skills Hub 生态还薄:社区技能库的规模目前还不能和成熟商业产品比,部分垂直场景的技能需要自己写。