~/reviews · Cognee · 2026-06-28

cat README.md | glow -p

Cognee

Cognee Logo

开源 AI Agent 记忆平台,为 AI Agent 提供跨会话的持久长期记忆,基于自托管知识图谱引擎。融合向量嵌入、知识图谱推理与认知科学本体论,让 AI 真正「记住」你做过的每一件事。

AI Memory GraphRAG Knowledge Graph Apache 2.0 Python

// 目录

$ 问题 $ 判断 $ 概览 $ ECL 管线 $ 核心能力 $ 代码示例 $ 基准测试 $ 竞品对比 $ 评分

// 我最近被一个问题困住了

做 AI 编程评测以来,我有一个体会越来越强烈:AI Agent 最大的瓶颈不是模型能力,是没有记忆。

Claude Code 写完代码,下次启动时完全不知道项目里有什么文件。Cursor Agent 做了一次重构,下周完全不记得改了哪些模块。我每次都要花 5-10 分钟重新喂上下文——「这是一个 Python 项目,目录结构是 xxx,你上次改了 yyy,现在需要 zzz」。

模型越来越强,但 Agent 越来越像金鱼。换个会话就清零,换个工具就失忆。这不是 Claude 的问题,不是 Cursor 的问题——是整个 AI Agent 生态缺了一个基础设施层:持久记忆。

直到我在 GitHub Trending 上看到 Cognee,读完它的论文和源码,我才发现这个问题已经有团队系统性地在解决了。


// 我的判断

AI Agent 的记忆不是「存更多数据」的问题,而是「存对的数据、建对的关系、在对的时刻调对的信息」的问题。向量检索只能回答「这段文字像不像」,知识图谱才能回答「这件事和那件事什么关系」——而 Cognee 是第一个把两者做成统一记忆层的开源方案。

// 概览

GitHub Stars
24,116
今日新增 +780 | 近三月持续增长
Forks / Issues
2,258 / 325
Fork/Star 比 0.09 | 活跃社区维护
Contributors
80+
Vasilije1990 (2596) + dexters1 (1854) + hajdul88 (714)
License
Apache 2.0
完全开源 | 可商用 | MIT 级别自由
Latest Release
v1.2.2
2026-06-26 | Truth Subspace & Retrieval
Language / Created
Python
2023-08-16 | 8,426 commits | Bus Factor ≈3

// Cognee 是什么

Cognee 是 Topoteretes 团队(总部柏林,$7.5M Seed 轮融资)开发的开源 AI Agent 记忆控制平面。核心定位一句话:用 6 行代码,把混乱的多模态数据变成 AI Agent 的长期记忆。

它不是 Mem0 那种「对话事实抽取」记忆层,也不是 Zep 那种「时序事实追踪」记忆层——Cognee 是把数据当知识图谱来经营的记忆层。搭配独家 ECL Pipeline(Extract → Cognify → Load)与 RDF/OWL 本体论验证,在 HotPotQA 多跳问答基准上拿到 0.93 的分数,接近人类标注者上限。

remember() turning a sentence into a memory graph cognee.remember() reads "Vasilije founded cognee in Berlin", highlights three entities, which sprout as glowing purple nodes connected by labeled edges and link into existing memory. Turn a sentence into a memory graph agents can reason over cognee.remember() Vasilije founded cognee in Berlin existing memory founded based in Vasilije cognee Berlin
Cognee 记忆机制:remember() 将数据摄入知识图谱,建立实体关联

// 独家 ECL 管线

Cognee 最容易跟其他记忆层混淆的,就是它的 ECL(Extract → Cognify → Load)三段式 Pipeline。这套架构的设计哲学承袭传统数据仓库的 ETL,但把中间的「Transform」换成了「Cognify」(认知化),引入了本体论验证、跨文件指代消解、RDF/OWL URI 对齐等处理步骤。

STEP 1-2
Extract
30+ 连接器
PDF/Notion/Slack
Audio/Image/Code
STEP 3
Chunk
语义连贯分块
跨文件指代消解
非固定字符切分
STEP 4
Cognify
LLM 实体三元组
本体论 RDF/OWL
URI 实体去重
STEP 5
Load
KG + Vector 双写
Neo4j/Qdrant
Postgres 单库模式
STEP 6
Recall
BFS 图谱遍历
向量相似度
时序过滤混合

六个步骤里最被低估的是第 4 步 Cognify(认知化)。传统的 RAG 系统跳过了这一步——直接把文本切片塞进向量库就完事了。但 Cognee 在这一步用 LLM 提取实体三元组(subject-predicate-object),同时做本体论验证和 URI 标准化。

举个例子:你的文档里出现了「ChatGPT-4」「GPT-4 turbo」「OpenAI gpt-4」三种写法,Cognee 的 Cognify 步骤会把它们统一成 uri:openai:gpt-4。这个机制是 RAG 系统最常跳过的一步,但恰恰是多跳推理质量的决胜点。

recall() answering a question from the memory graph cognee.recall() reads "Where is cognee based?", lights up the path from the cognee node along the "based in" edge to Berlin, and returns the grounded answer "cognee is based in Berlin". Ask a question and get answers grounded in your graph cognee.recall() Where is cognee based? existing memory based in Vasilije cognee Berlin cognee is based in Berlin
Cognee 回忆机制:混合图谱 BFS 遍历 + 向量相似度 + 时序过滤

// 真正打动我的几个能力

4 个 API 操作——业界最简洁的记忆接口

Cognee 把记忆层拆成 4 个直观动词:remember() 写入、recall() 读取、forget() 移除、improve() 强化。

这个设计学的是认知科学里的「主动记忆四阶段」——当 AI Agent 收到人类反馈后,improve() 会根据反馈重新加权图谱边,把「常用而正确」的关联往上提,把「过时而错误」的关联往下压。

全内存层跑在 Postgres 上

传统图谱记忆需要独立部署图数据库(关系)、向量数据库(嵌入)、Redis(会话)、关系型数据库(元数据)四套基础设施。Cognee 1.0 支持所有内存层运行在单个 Postgres 实例上——图谱、文本、元数据、嵌入都在同一个 Postgres 里,CI 基准测试中搜索速度比独立图+向量方案快约 10%。

Claude Code 插件——跨会话持久记忆

这是我最想试的功能。Cognee 为 Claude Code 提供了完整的记忆插件,自动捕获 Prompt、工具调用痕迹、助手响应到会话记忆,每次 Prompt 时注入相关上下文,会话结束时同步到永久知识图谱。相当于给 Claude Code 装了一个「永不遗忘的大脑」。

多平台一键部署

除了 Docker 自托管,Cognee 还支持 Modal(无服务器 GPU)、Railway、Fly.io、Render、Daytona 等平台的一键部署。还有全托管 Cognee Cloud 服务。


// 6 行代码上手

# 安装 uv pip install cognee # 设置 LLM API Key export LLM_API_KEY="sk-..." # 6 行代码构建 Agent 记忆 import cognee import asyncio async def main(): # 永久存储到知识图谱 await cognee.remember("Cognee turns documents into AI memory.") # 查询(自动选择最优搜索策略) results = await cognee.recall("What does Cognee do?") for result in results: print(result) asyncio.run(main())

也可以用 CLI:

# 记忆内容 cognee-cli remember "Cognee turns documents into AI memory." # 查询内容 cognee-cli recall "What does Cognee do?" # 启动本地 UI(需要 Docker) cognee-cli -ui

// 视频演示

Cognee 官方演示:Knowledge Engine for AI Agent Memory(YouTube, 2,390 次观看)
Cognee Demo GIF
Cognee 交互演示:从数据摄入到知识图谱构建的完整流程

// 基准测试——多跳推理 0.93 是什么概念

官方使用 BEAM(长上下文基准测试)测试 Cognee 默认配置:

Cognee (100K)
0.79
Cognee (10M)
0.67
此前 SOTA (100K)
0.735
此前 SOTA (10M)
0.641
RAG 基线
~0.33

在 HotPotQA 多跳问答基准上,Cognee 拿到 0.93 接近人类标注者上限,而纯向量 RAG 只能达到 0.5-0.6。在 Musique 基准上 Cognee 也领先纯向量 RAG +37%。

这个差距说明了一件事:纯向量检索在处理「需要跨多个文档才能答对」的问题时有天然天花板。向量只能告诉你「这段文字像不像」,但 Cognee 的知识图谱能告诉你「这个实体和那个实体是什么关系」——这是本质差异。


// AI 记忆层五大门派

AI Agent 记忆层目前形成了五个流派,各自解决不同的问题:

项目定位核心优势短板
Cognee GraphRAG 图谱记忆 HotPotQA 0.93 | 本体论 URI 去重 | ECL 管线 Cloud Beta | 时序推理弱 | 学习曲线陡
Mem0 通用 SDK 记忆层 41K Stars | 框架整合最广 | AWS Agent SDK 多跳推理弱 | 知识图谱缺位
Zep 时序事实追踪 Graphiti 双时间轴 | SOC2/HIPAA/GDPR 图谱推理不如 Cognee | 定价较高
Letta (MemGPT) OS 风格自主代理 Heartbeat 自治 | Core/Recall/Archival 三层 记忆层不是核心 | 生产化待验证
Supermemory 编码代理记忆 LongMemEval 85.4% | Sub-300ms | MCP 非通用记忆层 | 偏开发者场景

一句话选型:需要多跳推理+知识文档深度连接 → Cognee;需要通用 SDK+框架整合 → Mem0;需要时序事实追踪+企业合规 → Zep;需要 OS 风格代理自主 → Letta;需要编码代理+IDE 整合 → Supermemory。


// 博主评分

VERDICT
8.5
/ 10
方向 9.5 · 实用性 8.5 · 成熟度 8.0 · 生态 7.5
✦ 优点
· HotPotQA 0.93 多跳推理人类等级——这是最硬的数字
· ECL Pipeline 六步模块化,每一步可单独替换测试
· 本体论 RDF/OWL URI 自动实体去重,知识图谱不被噪音稀释
· Knowledge Graph + Vector 双引擎,不是二选一
· 30+ 数据连接器,多模态摄入远超同类
· Apache 2.0 开源,80+ 贡献者,活跃社区
· 4 API 操作业界最简洁,学习曲线平缓
· $7.5M Seed + 学术论文背书,商业续航力够
✦ 不足
· Cloud SaaS 仍 Beta,Dashboard 和文档在补齐中
· 1 GB 数据处理需约 40 分钟 + 100 容器,TB 级有压力
· TypeScript SDK 不完整,Python 是一等公民
· 无移动端 SDK,时序推理不如 Zep Graphiti 双时间轴
· 本体论需自备 RDF/OWL,小团队学习成本高
· 图谱 BFS 遍历延迟不适合 Sub-300ms 场景

// 跟我在做的事有什么关系

我做 GitHub AI 日报评测,评测本身就是一个需要记忆的场景——之前评测过的项目、踩过的坑、做出的判断,如果每篇都要重新查一遍,效率很低。

Cognee 给我三个启发:

评测自动化需要记忆层。我已经在维护自动化评测流程,但如果能用 Cognee 把每次评测的结论、竞品对比、评分都存入知识图谱,下次遇到类似项目时自动关联历史判断,评测的深度和一致性会提升一个量级。

ECL Pipeline 的「先认知化再存储」思路可以迁移。我现在的自动化流程是「采集→分析→生成文章」,中间缺了一步「结构化认知」。如果把分析结果先做实体抽取和关系建模(类似 Cognify),存入结构化知识库,文章的深度会比现在的「一次调研一次生成」强得多。

记忆是 AI Agent 成为「工具」而不是「玩具」的最后一块拼图。我评测过的项目越多,越觉得模型能力已经不是瓶颈了——真正的瓶颈是每次重新启动 Agent 就像面对一个失忆症患者。Cognee 解决的问题,是所有做 Agent 产品的人都绕不过去的。


// 适合谁,不适合谁

适合

· 做企业文档问答,需要多跳推理能力
· 构建知识图谱驱动的智能搜索,想替代纯向量 RAG
· 科研/医疗/法律/制药场景,有本体论需求且数据不出公司
· 已有 Neo4j 等图数据库资产,想接入 LLM
· 需要 PDF/影像/音频多模态整合的文档管理系统

不适合

· 只需要简单对话记忆 → Mem0 更轻量
· 时序事实追踪是核心需求 → Zep 的 Graphiti 更强
· 编码 Agent + IDE 整合 → Supermemory 更专注
· 移动 App 场景(缺 Mobile SDK)
· 需要 Sub-300ms 低延迟的实时系统


// links

GitHub: topoteretes/cognee
官网: cognee.ai
文档: docs.cognee.ai
论文: Optimizing the Interface Between Knowledge Graphs and LLMs for Complex Reasoning
Discord 社区
YouTube 演示视频
深度评测参考: AI 织梦 Cognee 评测