Trending AI · 今日第 2 名

agentmemory:让 AI 编程助手真正记住你做过什么

📅 2026年5月14日
7,657 Stars(今日 +1,335)
⚙️ TypeScript · Apache-2.0
🏷️ AI Coding · Memory · MCP
8.4 / 10
目录导航

先说我的真实感受

上周我在用 Claude Code 重构一个遗留 API,项目里有个历史决策让我纠结了很久——之前为什么选 jose 而不是 jsonwebtoken?Edge 浏览器的兼容性问题?还是单纯图轻量?我翻了好几个 commit 记录才找到答案。

如果那时候有 agentmemory,这个时间就省了。

这不是在吹它——我的意思是,这个问题确实存在,而且每个天天用 AI 编程的人多少都碰到过。agentmemory 做的事很简单:让 AI 记住它做了什么,以及为什么这么做。 听起来理所当然,但做起来其实挺难的。

这个项目解决什么问题

所有主流 AI 编程工具(Claude Code、Cursor、Codex 等)有一个共同的致命缺陷:会话结束,一切归零。

你跟 Claude Code 花 20 分钟对齐了项目上下文,下次新建会话,它完全不记得你们聊过什么。技术栈选了啥、哪个文件动过、为什么排除某个方案——全丢了。然后你又要花 5-10 分钟重新解释一遍。

agentmemory 的核心思路是:做一个后台服务,自动捕获每一次工具调用,把它们压缩成结构化记忆,等下次会话开始时自动注入上下文。 整个过程不需要你手动操作任何东西。

Session 1:
  "给 API 加 auth"
  → Claude Code 写代码、跑测试、修 bug
  → agentmemory 后台静默捕获每个工具调用
  → 会话结束 → 压缩为结构化记忆

Session 2:
  "现在加限流"
  → Claude Code 已知:auth 用了 JWT 中间件,
    测试覆盖了 12 个 case,选了 jose 而非 jsonwebtoken(Edge 兼容性)
  → 直接开始干活,不需要重复解释
这个项目 2026 年 2 月 25 日创建,到今天(5月14日)刚好 11 周,已经积累了 7,657 Stars、34 个 release——这个速度确实有点疯狂。

核心技术架构

记忆四层架构

这套系统借鉴了人类大脑的记忆巩固机制,分了四个层次:

Working Memory
存储每次工具调用的原始观测——调了哪个工具、传了什么参数、返回了什么结果。去重靠 SHA-256 哈希,5 分钟内的重复调用不会重复写入。
Episodic Memory
每个会话结束时的压缩摘要,相当于"这次发生了什么"。自动生成,不需要人工介入。
Semantic Memory
从观测记录里提取出来的事实和模式——比如"项目用了 jose 做 JWT"、"这个模块没有单元测试"。
Procedural Memory
工作流和决策模式——"遇到性能问题先看 N+1 查询"、"第三方 API 优先用流式处理"。

有意思的是,这套系统还引入了艾宾浩斯遗忘曲线——频繁访问的记忆会被强化,长期不用的记忆会自动衰减或被驱逐出场。如果你问了一个之前存过的上下文,系统会悄悄给它加权重,下次更容易被召回。

三流检索

查记忆的时候不是单纯靠向量搜索,而是三种方式同时跑:

BM25
词干提取 + 同义词扩展关键词匹配,始终启用,对中文需要额外分词器。
Vector
余弦相似度稠密向量搜索,需要配置 embedding provider(支持 OpenAI/Gemini/Voyage/Cohere 或本地模型)。
Graph
知识图谱实体匹配 + BFS 遍历,问关系型问题时会自动触发。
RRF 融合
Reciprocal Rank Fusion(k=60)融合排序,每轮最多返回 3 条,避免上下文溢出。

12 个自动 Hook

对比一下竞品 mem0 需要手动调 add() 接口,agentmemory 在 Agent 的整个生命周期里埋了 12 个钩子,零手动操作:

SessionStart
记录项目路径和会话 ID
UserPromptSubmit
捕获用户指令(自动过滤敏感信息)
PreToolUse
记录文件访问模式 + 丰富上下文
PostToolUse
捕获工具调用的完整输入输出
PostToolUseFailure
错误上下文单独存储
Subagent Start/Stop
子 Agent 生命周期记录
Stop / SessionEnd
会话结束 → 摘要生成 → 知识图谱提取

MCP Server:51 个工具开箱即用

项目自带一套完整的 MCP Server,分 Core(8 个始终可用)和 Extended(开启全部 51 个)两档。

核心工具覆盖检索(memory_smart_searchmemory_recallmemory_profile)、写入(memory_savememory_compress_file)、管理(memory_sessionsmemory_export)、图谱查询(memory_relationsmemory_graph_query)、多 Agent 协作(排他锁 memory_lease、消息传递 memory_signal_send)。

另外还有 4 个斜杠命令:/recall(语义召回)、/remember(主动存入)、/session-history(查看会话历史)、/forget(主动遗忘)。

零外部依赖

运行时依赖 iii-engine(轻量级 KV 状态引擎),存储用 SQLite,向量嵌入可以选本地免费的 all-MiniLM-L6-v2,也可以接 OpenAI/Gemini/Voyage/Cohere 的付费 API。不需要 Postgres、不需要 Qdrant、不需要 Redis——装完直接跑。

性能数据

95.2%
R@5 LongMemEval-S
1,900
tokens / 会话
92%
上下文节省
~$10
年均 Embedding 成本

项目在 LongMemEval-S 基准测试上跑出了 R@5(Recall@5)95.2% 的成绩。作为参考:mem0 同期基准为 68.5%,Letta/MemGPT 为 83.2%。

⚠️ 基准测试没有第三方验证

95.2% 这个数字确实很漂亮,但 LongMemEval-S 是项目方自己跑、自己发的,mem0 和 Letta 的对比基准数据来源也没有第三方出处。在没有独立验证之前,这个数字建议保守看待。

Token 消耗方面,默认配置每会话约 1,900 tokens(相比全量注入节省约 92%)。如果用本地 embedding 模型做压缩,年均成本大约 $10;接 API embedding 的话按实际用量计费。

安装体验

最快上手(30秒)

# Terminal 1:启动服务器
npx @agentmemory/agentmemory

# Terminal 2:注入示例数据并演示搜索
npx @agentmemory/agentmemory demo

# 浏览器打开实时查看器
open http://localhost:3113

demo 命令会种子 3 个真实会话(JWT auth 实现、N+1 查询修复、rate limiting 添加),然后演示语义搜索——你搜"database performance optimization",它能找到"N+1 query fix",纯 BM25 是做不到这点的。

实时查看器(:3113)挺有意思,能看到会话流、记忆注入记录、搜索结果——调试的时候很实用。

Claude Code 集成

Install agentmemory: run `npx @agentmemory/agentmemory` in a separate terminal,
then run `/plugin marketplace add rohitg00/agentmemory`
and `/plugin install agentmemory`

插件注册会自动完成 12 个 hook、4 个斜杠命令、以及通过 .mcp.json 接入 51 个 MCP 工具。目前支持的 Agent 包括 Claude Code、Cursor、Cline、Roo Code、Windsurf、OpenClaw、Codex CLI、OpenCode、Kilo Code 等 32+ 个,而且支持 MCP 的新 Agent 可以直接接入,不需要等待项目方适配。

其他配置项

# 用中文分词器(需要额外安装)
npm install @node-rs/jieba

# 开启完整工具集
export AGENTMEMORY_TOOLS=all

# 指定 embedding provider
export AGENTMEMORY_EMBEDDING_PROVIDER=openai
export OPENAI_API_KEY=sk-...

和同类项目的真实对比

这块我多说几句,因为今天 GitHub Trending 上有几个类似定位的项目一起在涨。

项目 Stars 定位 差异化
agentmemory 7,657 记忆引擎 / 运行时 全自动 hooks + 零外部依赖 + MCP 广泛兼容 + 95.2% R@5
mattpocock/skills ~79,000 工程纪律提示词集 Skills 层管"怎么干活",两者互补
addyosmani/agent-skills ~41,100 Google 工程技能框架 22 个斜杠命令覆盖完整开发生命周期,两者互补
mem0 53,000 内存层 API 需 Qdrant/pgvector,手动 add(),框架锁定
Letta/MemGPT 22,000 完整 Agent 运行时 高框架绑定,需 Postgres + 向量数据库

mattpocock/skills 做的是"怎么干活"——TDD 流程、极简沟通(caveman 模式)、需求拷问(grill-me)、六阶段调试。它的本质是一套工程纪律的提示词模板。

agentmemory 做的是"记住什么"——跨会话的上下文持久化,不管你用什么规范干活,它负责让你下次不用重复解释。

这两个不是竞争关系,是互补关系。skills 约束 AI 的行为方式,agentmemory 负责上下文连续性。一起用效果更好:skills 管工程纪律,agentmemory 管项目记忆。

优点说够了的反面——我担心的几件事

1. iii-engine 的强依赖

agentmemory 底层跑在 iii-engine 上,当前 pinned 到 v0.11.2。如果 iii-engine 停止维护或者出现 breaking change,这个项目会很难办。iii-engine 不在 crates.io 上,Windows 安装要额外步骤,文档也相对少。这是个潜在的单点风险。

2. Bus factor ≈ 1

看了一下贡献数据,301 个 commits 里主创 rohitg00 贡献了大约 90%。34 个 release 说明维护非常密集,但一个人扛所有事情,长期看风险不小。项目才 11 周,还在快速迭代期,这个阶段单点贡献是正常的——但如果要上生产环境,需要考虑这个因素。

3. CJK 支持是硬伤

如果你的代码注释、提交信息、文档大量用中文,默认配置下的搜索效果会打折扣。原因是 BM25 依赖分词,中文整句粒度的 tokenization 精度不够。需要额外装 @node-rs/jieba 才能用中文分词。安装步骤有点折腾,配置文档也不够详细——希望下个版本能原生支持。

4. 企业功能还早

Roadmap 里写着 Q4 2026 上 SSO/RBAC/Q&A 导出,但当前版本还没有——如果你要给团队部署,需要等。多人协作的记忆隔离、权限控制、审计日志这些功能目前都是空白。

适合谁用

如果你每天用 Claude Code/Cursor 超过 2 小时、项目代码库超过 1 万行、经常在多个会话里推进同一个项目——agentmemory 值得一试。它解决的是真实痛点,安装成本很低(npx 一条命令),不需要任何外部服务。

如果你的项目代码主要是中文注释、或者你在找一个生产就绪的企业级记忆系统——目前阶段可能还要等等,或者先在非关键项目上试水。

综合评分

维度 评分 说明
痛点定位 9.0 真正戳中了 AI 编程的上下文丢失问题
技术实现 8.5 四层记忆+三流检索架构完整,SQLite 零依赖很加分
开发者体验 8.0 安装简单,demo 体验直观,CJK 支持是短板
性能数据 7.5 基准数字好看但缺第三方验证,保守看待
社区生态 7.5 增长极快,但项目年轻,单人维护有风险
竞品差异化 9.0 全自动 hooks + 零依赖 + MCP 广泛兼容,护城河清晰
文档完整性 7.0 核心文档清晰,进阶配置(embedding、CJK、多 Agent)文档不足
综合 8.4 / 10 个人开发者 / 小团队推荐试验关注

一句话总结

agentmemory 解决了 AI 编程工具最烦人的问题之一:每次新建会话都要重新解释上下文。它用 12 个自动 hooks + 四层记忆巩固 + 三流检索做到了"无感知的上下文连续性",零外部依赖,MCP 协议广泛兼容。

项目很年轻(11 周),增长很快(7,657 Stars),但也存在单人维护、CJK 支持弱、基准数据缺第三方验证等现实问题。适合个人开发者或小型团队在非关键项目上试验,如果是企业级部署,建议持续关注 Roadmap(v1.0 计划 Q1 2027)和 iii-engine 的社区健康度。