Mercury Agent 深度评测 | GitHub AI 项目

📊 项目概览

1,436

GitHub Stars（7天）

156

Forks

31

内置工具数

10

记忆类型

6

支持 LLM 提供商

3

支持平台（macOS/Linux/Win）

📖 背景与来历

Mercury Agent 由 Cosmic Stack Labs 于 2026 年 4 月 20 日发布，七天内斩获 1,436 Star，跻身本周 GitHub 新创建 AI 项目增速第一。项目核心理念来自一个简单的观察：市面上几乎所有 AI Agent 都能读文件、跑命令、抓网页，但它们做这些事的时候从不问你，也从不记住你。

Mercury 想解决的就是这两件事。它的设计哲学称之为"Soul-Driven"——Agent 的行为边界由你自己写的 Markdown 文件定义（soul.md / persona.md / taste.md / heartbeat.md），而不是被套在某个商业产品的默认提示词里。你把它当成一个有性格、有记忆、还知道什么事必须先问你的助手，而不只是命令执行器。

"Every AI agent can read files, run commands, and fetch URLs. Most do it silently. Mercury asks first — and remembers what matters."

名字取自太阳系中离太阳最近、运行最快的行星——水星（Mercury），暗示它定位于贴身、快速、常驻。

⚡ 核心功能

🔐

Permission-Hardened 权限强化

Shell 层内置高危命令黑名单（sudo、rm -rf / 等永远不会执行）。目录级别读写隔离，操作文件夹以外的路径需要显式授权。每次会话可选"每次询问"或"全部允许"两种模式，结果可预测，不会有意外。
🧠

Second Brain 结构化记忆

基于 SQLite + FTS5 全文搜索的持久化记忆系统，支持 10 种记忆类型（身份、偏好、目标、项目、习惯、决策、约束、关系、事件、反思）。每次对话后自动提取 0–3 条事实，附带置信度、重要性和时效性评分。每 60 分钟自动整合生成用户画像摘要，低置信记忆 120 天后自动淘汰。所有数据存在本地，不上传。
🎭

Soul 文件定义人格

用户通过编辑 ~/.mercury/soul/ 下的几个 Markdown 文件来定义 Agent 的性格、口吻、审美取向和心跳节律（heartbeat），而不是被套在工具自带的僵硬提示词里。人格真正属于你。
💰

Token 预算管理

内置每日 Token 用量追踪。超过日预算 70% 时自动切换为简洁模式，减少每次请求的 Token 消耗。支持 /budget 命令随时查看、重置或临时覆盖限制。
📡

多渠道接入（CLI + Telegram）

CLI 模式支持实时流式输出，Token 边打印边渲染 Markdown。Telegram 模式支持可编辑消息、文件上传、打字指示器，多用户通过管理员审批制接入，admin/member 权限分级。私聊专用，群消息自动忽略。
🔄

Daemon 常驻模式

一条命令 mercury up 即可注册为系统服务，开机自启，进程崩溃后指数退避自动重启（每分钟最多 10 次）。支持 macOS LaunchAgent、Linux systemd、Windows Task Scheduler，均无需管理员权限。
🔌

技能生态（Agent Skills）

遵循 Agent Skills 规范，支持一键安装社区技能，并可将技能以 Cron 表达式调度为定时任务。内置工具覆盖文件系统、Shell、Git、Web 抓取、消息发送、调度器共 31 个工具。
🌐

多 LLM 提供商自动切换

默认使用 DeepSeek（成本最低），配置了 OpenAI / Anthropic / Grok / Ollama Cloud / Ollama Local 后，任何提供商失败时自动 fallback。记住上次成功的提供商，下次优先尝试。

🏗️ 技术架构

核心技术栈

层级	技术选型	作用
运行时	TypeScript + Node.js 18+ ESM	主体框架，tsup 构建
LLM 调用	Vercel AI SDK v4	generateText + streamText，10步 agentic loop，provider fallback
Telegram 集成	grammY	打字指示器、可编辑流式消息、文件上传
记忆存储	SQLite + FTS5	Second Brain 全文搜索、冲突解决、自动整合
短期/事件记忆	JSONL 文件	会话 JSON、长期事实提取、时间线事件日志
后台服务	PID 文件 + watchdog	Daemon spawn、崩溃恢复、系统服务注册

Agentic Loop 设计原则

Mercury 采用 10 步 Agentic Loop，并在架构层面强制要求每个工具必须遵守的设计原则：

🧠 Think in loops

工具会被每次对话多次调用，幂等性是必须的

🔐 Permission-first

所有外部操作（文件/Shell/网络/Git）必须过权限层，不允许假设授权

💾 Memory-aware

产生用户事实的功能需挂接 Second Brain；读取用户数据时先查记忆

📏 Token-conscious

日志、详细输出、大型上下文都会烧 Token，始终保持精简

🔌 Channel-agnostic

工具在 CLI 和 Telegram 上行为完全一致，不依赖终端或人工响应

🔁 Graceful degradation

Provider 失败、工具报错、文件不存在——都要恢复，不允许崩溃

数据流向

每次对话完整路径：用户输入 → 从 Second Brain 注入 top-5 相关记忆（≤900 token）→ LLM 生成（Agentic Loop，最多 10 步）→ 工具调用（过权限层）→ 流式输出给渠道 → 对话结束后自动提取 0–3 条记忆写回 SQLite。

🚀 安装与使用

最快上手方式

bash · npx 零安装直接运行

# 不需要安装，直接运行
npx @cosmicstack/mercury-agent

全局安装

bash · 全局安装 + 启动

# 全局安装
npm i -g @cosmicstack/mercury-agent

# 首次运行：30 秒配置向导（名字 + API Key + 可选 Telegram Bot Token）
mercury

# 以后重新配置
mercury doctor

启动为常驻后台服务

bash · Daemon 模式

# 一键注册系统服务 + 启动（推荐）
mercury up

# 查看日志
mercury logs

# 停止 / 重启
mercury stop
mercury restart

常用对话命令

chat · 对话中直接输入（不消耗 Token）

/status           # 查看配置、预算和用量
/budget           # 查看 Token 预算状态
/budget set 50000 # 设置每日 50k Token 上限
/memory           # 查看和管理 Second Brain
/permissions      # 切换权限模式（询问 / 全部允许）
/tools            # 列出所有已加载工具
/skills           # 列出已安装技能

Telegram 接入流程

bash · 3步搞定 Telegram 接入

# 1. 在 mercury.yaml 中填写 Telegram Bot Token
# 2. 在 Telegram 向 Bot 发送 /start，获得配对码
# 3. 在 CLI 审批
mercury telegram approve <code>

# 之后可随时管理用户
mercury telegram list

⚔️ 竞品对比

把 Mercury 放在个人 AI Agent 这个赛道里横向比较，选取当前 GitHub 最具代表性的几个项目：

项目	Stars	常驻守护	权限系统	持久记忆	多渠道	Token预算	零依赖安装
Mercury Agent	1,436	✓ 系统服务	✓ 细粒度	✓ SQLite	✓ CLI+TG	✓ 内置	✓ npx
AutoGPT	183,794	△ 需配置	✗ 基础	△ 有但简单	△ Web UI	✗	✗ 重依赖
OpenClaw	364,725	✓	✓	✓	✓ 多端	△	△ 安装较复杂
Harmonist	695	✗	△ 协议约束	✗	✗ 仅IDE	✗	✓
CrewAI	~28,000	✗	△ 角色隔离	△ 插件形式	✗	✗	✗

Mercury 最明显的差异点在于：它是一个为个人用户设计的、真正意义上的 24/7 个人助手，而 AutoGPT / CrewAI 更像面向开发者和团队的任务自动化框架，两者使用场景有明显的分叉。

🎯 适用场景

🛡️

安全敏感的个人电脑

权限强化 + 操作询问机制，适合不希望 AI 自主乱改文件的用户

📱

Telegram 异地遥控

服务器 Daemon 模式 + Telegram Bot，出门在外也能管控本地或远端机器

🧑‍💻

开发工作流助手

内置 Git 工具套件 + 文件读写，常驻后台随时唤醒，记住项目偏好

💸

成本敏感的个人用户

默认 DeepSeek 最低成本，Token 预算控制，不会一不留神超支

📅

定时自动化任务

Cron 调度 + Skill 生态，实现每天定时跑脚本、生成报告等周期性任务

🎨

追求个性化体验

Soul 文件完全自定义人格，适合想要一个"有自己风格"的 AI 助手的用户

⚠️ 局限性

优势

权限系统细粒度，不会乱做事
记忆系统设计扎实，10类结构化存储
零云依赖，所有数据本地 SQLite
npx 一行启动，上手成本极低
多 LLM 提供商自动 fallback
Soul 文件人格完全用户可控
7天 1,400+ Stars，社区响应热烈

局限

项目仅 7 天历史，生产稳定性有待验证
技能生态刚起步，社区插件数量有限
不支持多 Agent 协作，单实例设计
Telegram 之外暂无 Web UI
Google Gemini / Mistral 支持还在路线图中
Disclaimer 声明"AI 可能出错，风险自担"

🏆 综合评分

安全性

9.2

易用性

8.8

功能完整度

8.5

可扩展性

8.3

文档质量

8.6

社区活跃度

8.0

综合评分：8.7 / 10

Mercury Agent 在个人 AI 助手赛道上交出了一份出色的首秀答卷。权限安全和记忆系统是其他大多数开源 Agent 的明显短板，而 Mercury 从一开始就把它们放在核心位置。7 天超过 1,400 Stars 的增速说明这个方向确实踩到了开发者的痛点。项目刚刚起步，技能生态和稳定性尚待时间检验，但作为个人常驻 AI 助手的首选方案，值得现在就上手试试。

Mercury Agent