🔥 今日 GitHub AI 热门 #1

Mercury Agent

灵魂驱动的全天候 AI 助手——权限安全、Token 预算、Second Brain 记忆,7 天从零增长 1,436 Stars

TypeScript · Node.js ⭐ 1,436 Stars MIT 开源 2026-04-20 创建
8.7
综合评分
9.2
安全性
8.8
易用性
8.5
功能完整度
8.3
可扩展性
+1,436
7天 Stars 增量

📊 项目概览

1,436
GitHub Stars(7天)
156
Forks
31
内置工具数
10
记忆类型
6
支持 LLM 提供商
3
支持平台(macOS/Linux/Win)

📖 背景与来历

Mercury Agent 由 Cosmic Stack Labs 于 2026 年 4 月 20 日发布,七天内斩获 1,436 Star,跻身本周 GitHub 新创建 AI 项目增速第一。项目核心理念来自一个简单的观察:市面上几乎所有 AI Agent 都能读文件、跑命令、抓网页,但它们做这些事的时候从不问你,也从不记住你

Mercury 想解决的就是这两件事。它的设计哲学称之为"Soul-Driven"——Agent 的行为边界由你自己写的 Markdown 文件定义(soul.md / persona.md / taste.md / heartbeat.md),而不是被套在某个商业产品的默认提示词里。你把它当成一个有性格、有记忆、还知道什么事必须先问你的助手,而不只是命令执行器。

"Every AI agent can read files, run commands, and fetch URLs. Most do it silently. Mercury asks first — and remembers what matters."

名字取自太阳系中离太阳最近、运行最快的行星——水星(Mercury),暗示它定位于贴身、快速、常驻。

核心功能

  • 🔐
    Permission-Hardened 权限强化
    Shell 层内置高危命令黑名单(sudorm -rf / 等永远不会执行)。目录级别读写隔离,操作文件夹以外的路径需要显式授权。每次会话可选"每次询问"或"全部允许"两种模式,结果可预测,不会有意外。
  • 🧠
    Second Brain 结构化记忆
    基于 SQLite + FTS5 全文搜索的持久化记忆系统,支持 10 种记忆类型(身份、偏好、目标、项目、习惯、决策、约束、关系、事件、反思)。每次对话后自动提取 0–3 条事实,附带置信度、重要性和时效性评分。每 60 分钟自动整合生成用户画像摘要,低置信记忆 120 天后自动淘汰。所有数据存在本地,不上传。
  • 🎭
    Soul 文件定义人格
    用户通过编辑 ~/.mercury/soul/ 下的几个 Markdown 文件来定义 Agent 的性格、口吻、审美取向和心跳节律(heartbeat),而不是被套在工具自带的僵硬提示词里。人格真正属于你。
  • 💰
    Token 预算管理
    内置每日 Token 用量追踪。超过日预算 70% 时自动切换为简洁模式,减少每次请求的 Token 消耗。支持 /budget 命令随时查看、重置或临时覆盖限制。
  • 📡
    多渠道接入(CLI + Telegram)
    CLI 模式支持实时流式输出,Token 边打印边渲染 Markdown。Telegram 模式支持可编辑消息、文件上传、打字指示器,多用户通过管理员审批制接入,admin/member 权限分级。私聊专用,群消息自动忽略。
  • 🔄
    Daemon 常驻模式
    一条命令 mercury up 即可注册为系统服务,开机自启,进程崩溃后指数退避自动重启(每分钟最多 10 次)。支持 macOS LaunchAgent、Linux systemd、Windows Task Scheduler,均无需管理员权限。
  • 🔌
    技能生态(Agent Skills)
    遵循 Agent Skills 规范,支持一键安装社区技能,并可将技能以 Cron 表达式调度为定时任务。内置工具覆盖文件系统、Shell、Git、Web 抓取、消息发送、调度器共 31 个工具。
  • 🌐
    多 LLM 提供商自动切换
    默认使用 DeepSeek(成本最低),配置了 OpenAI / Anthropic / Grok / Ollama Cloud / Ollama Local 后,任何提供商失败时自动 fallback。记住上次成功的提供商,下次优先尝试。

🏗️ 技术架构

核心技术栈

层级技术选型作用
运行时TypeScript + Node.js 18+ ESM主体框架,tsup 构建
LLM 调用Vercel AI SDK v4generateText + streamText,10步 agentic loop,provider fallback
Telegram 集成grammY打字指示器、可编辑流式消息、文件上传
记忆存储SQLite + FTS5Second Brain 全文搜索、冲突解决、自动整合
短期/事件记忆JSONL 文件会话 JSON、长期事实提取、时间线事件日志
后台服务PID 文件 + watchdogDaemon spawn、崩溃恢复、系统服务注册

Agentic Loop 设计原则

Mercury 采用 10 步 Agentic Loop,并在架构层面强制要求每个工具必须遵守的设计原则:

🧠 Think in loops

工具会被每次对话多次调用,幂等性是必须的

🔐 Permission-first

所有外部操作(文件/Shell/网络/Git)必须过权限层,不允许假设授权

💾 Memory-aware

产生用户事实的功能需挂接 Second Brain;读取用户数据时先查记忆

📏 Token-conscious

日志、详细输出、大型上下文都会烧 Token,始终保持精简

🔌 Channel-agnostic

工具在 CLI 和 Telegram 上行为完全一致,不依赖终端或人工响应

🔁 Graceful degradation

Provider 失败、工具报错、文件不存在——都要恢复,不允许崩溃

数据流向

每次对话完整路径:用户输入 → 从 Second Brain 注入 top-5 相关记忆(≤900 token)→ LLM 生成(Agentic Loop,最多 10 步)→ 工具调用(过权限层)→ 流式输出给渠道 → 对话结束后自动提取 0–3 条记忆写回 SQLite。

🚀 安装与使用

最快上手方式

bash · npx 零安装直接运行
# 不需要安装,直接运行
npx @cosmicstack/mercury-agent

全局安装

bash · 全局安装 + 启动
# 全局安装
npm i -g @cosmicstack/mercury-agent

# 首次运行:30 秒配置向导(名字 + API Key + 可选 Telegram Bot Token)
mercury

# 以后重新配置
mercury doctor

启动为常驻后台服务

bash · Daemon 模式
# 一键注册系统服务 + 启动(推荐)
mercury up

# 查看日志
mercury logs

# 停止 / 重启
mercury stop
mercury restart

常用对话命令

chat · 对话中直接输入(不消耗 Token)
/status           # 查看配置、预算和用量
/budget           # 查看 Token 预算状态
/budget set 50000 # 设置每日 50k Token 上限
/memory           # 查看和管理 Second Brain
/permissions      # 切换权限模式(询问 / 全部允许)
/tools            # 列出所有已加载工具
/skills           # 列出已安装技能

Telegram 接入流程

bash · 3步搞定 Telegram 接入
# 1. 在 mercury.yaml 中填写 Telegram Bot Token
# 2. 在 Telegram 向 Bot 发送 /start,获得配对码
# 3. 在 CLI 审批
mercury telegram approve <code>

# 之后可随时管理用户
mercury telegram list

⚔️ 竞品对比

把 Mercury 放在个人 AI Agent 这个赛道里横向比较,选取当前 GitHub 最具代表性的几个项目:

项目 Stars 常驻守护 权限系统 持久记忆 多渠道 Token预算 零依赖安装
Mercury Agent 1,436 ✓ 系统服务 ✓ 细粒度 ✓ SQLite ✓ CLI+TG ✓ 内置 ✓ npx
AutoGPT 183,794 △ 需配置 ✗ 基础 △ 有但简单 △ Web UI ✗ 重依赖
OpenClaw 364,725 ✓ 多端 △ 安装较复杂
Harmonist 695 △ 协议约束 ✗ 仅IDE
CrewAI ~28,000 △ 角色隔离 △ 插件形式

Mercury 最明显的差异点在于:它是一个为个人用户设计的、真正意义上的 24/7 个人助手,而 AutoGPT / CrewAI 更像面向开发者和团队的任务自动化框架,两者使用场景有明显的分叉。

🎯 适用场景

🛡️

安全敏感的个人电脑

权限强化 + 操作询问机制,适合不希望 AI 自主乱改文件的用户

📱

Telegram 异地遥控

服务器 Daemon 模式 + Telegram Bot,出门在外也能管控本地或远端机器

🧑‍💻

开发工作流助手

内置 Git 工具套件 + 文件读写,常驻后台随时唤醒,记住项目偏好

💸

成本敏感的个人用户

默认 DeepSeek 最低成本,Token 预算控制,不会一不留神超支

📅

定时自动化任务

Cron 调度 + Skill 生态,实现每天定时跑脚本、生成报告等周期性任务

🎨

追求个性化体验

Soul 文件完全自定义人格,适合想要一个"有自己风格"的 AI 助手的用户

⚠️ 局限性

优势

  • 权限系统细粒度,不会乱做事
  • 记忆系统设计扎实,10类结构化存储
  • 零云依赖,所有数据本地 SQLite
  • npx 一行启动,上手成本极低
  • 多 LLM 提供商自动 fallback
  • Soul 文件人格完全用户可控
  • 7天 1,400+ Stars,社区响应热烈

局限

  • 项目仅 7 天历史,生产稳定性有待验证
  • 技能生态刚起步,社区插件数量有限
  • 不支持多 Agent 协作,单实例设计
  • Telegram 之外暂无 Web UI
  • Google Gemini / Mistral 支持还在路线图中
  • Disclaimer 声明"AI 可能出错,风险自担"

🏆 综合评分

安全性
9.2
易用性
8.8
功能完整度
8.5
可扩展性
8.3
文档质量
8.6
社区活跃度
8.0

综合评分:8.7 / 10

Mercury Agent 在个人 AI 助手赛道上交出了一份出色的首秀答卷。权限安全和记忆系统是其他大多数开源 Agent 的明显短板,而 Mercury 从一开始就把它们放在核心位置。7 天超过 1,400 Stars 的增速说明这个方向确实踩到了开发者的痛点。项目刚刚起步,技能生态和稳定性尚待时间检验,但作为个人常驻 AI 助手的首选方案,值得现在就上手试试。

🔗 参考链接