118+ 应用集成、20 分钟冷启动、Obsidian 级知识库——这个项目正在重新定义「AI 助手」该有的样子。
说个真事。上周五我让 Claude Code 帮我重构一段 Python API 调用的代码,改了十几轮,改到中间的时候它突然忘了前面讨论过什么,从头开始问一遍。我当时就一个感觉——这玩意儿没有记忆。
大部分 AI 助手都是这样。你跟它聊了一个小时,关掉窗口,下次打开,它对你一无所知。你得重新解释你是谁、项目是什么、你在做什么。这不叫「助手」,这叫「每次都重新认识的临时工」。
OpenHuman 试图解决这个问题,而且思路比我见过的任何项目都更激进。
它的核心想法是:AI 助手的记忆,不应该只是对话历史的存储,而应该就是你的知识库本身。它把这个东西叫做 Memory Tree——一棵从你所有数据源自动生长出来的记忆树,存在你本机的 SQLite 里,同时直接输出为 Obsidian Vault 兼容的 Markdown。换句话说,你的 AI 助手和你的个人知识库是同一个东西。
今天日增 3,329 Star,总 Star 7,764,社区增长速度很快。而且这不是一个光有概念的项目——1,817 次提交、34 个 Release、最新版本 v0.53.43,迭代节奏相当猛烈。
| 仓库地址 | tinyhumansai/openhuman |
| 创建时间 | 2026-02-18(约 3 个月) |
| 主要语言 | Rust 70.1% / TypeScript 25.7% / JavaScript 2.2% |
| 许可证 | GPL-3.0 |
| 桌面框架 | Tauri + CEF(Chromium Embedded Framework) |
| 开发状态 | Early Beta(v0.53.43) |
| 创始团队 | Tiny Humans AI(@senamakel) |
这是 OpenHuman 最核心的卖点,也是最值得说的地方。
传统 AI 助手的「记忆」要么不存在(每次都是新的),要么只是简单地把对话历史存下来再喂回去(上下文窗口塞满就丢掉)。OpenHuman 的做法完全不同:它建了一棵「记忆树」。
具体运作是这样的:你通过 OAuth 一键连接 118+ 第三方服务(Gmail、Notion、GitHub、Slack、Stripe、Calendar、Drive、Linear、Jira 等等),然后 OpenHuman 每 20 分钟自动轮询这些服务,把拉回来的数据规范化成 ≤3k token 的 Markdown 块,评分后折叠进一棵层级摘要树。这棵树存在你本机的 SQLite 数据库里。
最妙的是,这棵树同时就是一个 Obsidian 兼容的 Vault。你可以用 Obsidian 直接打开、浏览、编辑你的 AI 记忆。这是从 Andrej Karpathy 的 obsidian-wiki 工作流里汲取的灵感,但做得更自动化——你什么都不用做,AI 自己就在「学习」你。
它不是简单存原始数据。它会把一封长邮件压缩成一个 3k token 以内的摘要块,给每个块打分,低分的沉底,高分的上浮。时间长了,你的工作习惯、项目上下文、常用工具、甚至你写代码的风格偏好,都会被逐步沉淀下来。理论上,你用了一个月之后,这个 Agent 就已经比任何新对话都要「懂你」了。
118 个应用的数据全部拉下来再喂给 LLM,token 开销会炸的。OpenHuman 自己写了一套压缩引擎叫 TokenJuice,处理所有工具调用返回、网页抓取结果、邮件正文、搜索 payload。
它做了什么?HTML → Markdown 转换、长 URL 缩短、非 ASCII 字符移除。听起来没什么花哨的,但效果惊人——官方宣称可以压缩 80% 的 token 消耗。这意味着你的 API 费用和响应延迟可以同时大幅降低。
我个人的看法是,80% 这个数字大概率是在特定场景下的峰值(比如纯 HTML 邮件压缩),实际平均压缩率可能在 50-60% 左右。但即使是这样,在 118 个数据源的场景下,这也是必要的。
OpenClaw、Hermes Agent 这些框架都能接入第三方服务,但流程是 BYO(Bring Your Own)——你自己写 Connector、自己配 API Key、自己处理认证。OpenHuman 直接内置了 118+ 个服务的一键 OAuth 连接。
Gmail、Notion、GitHub、Slack、Stripe、Calendar、Google Drive、Linear、Jira……点一下授权就完了。每个连接都会作为 typed tool 暴露给 Agent,Agent 可以直接调用。
这个体验上的差距是巨大的。对比一下:OpenClaw 你要自己装插件、配 MCP Server、写 tool 定义;OpenHuman 你点几下按钮就全搞定了。
大部分 Agent 的数据获取是被动式的——你问,它才去查。OpenHuman 每 20 分钟自动轮询所有已连接的服务,把最新数据拉到本地记忆里。
这意味着你早上起来打开 OpenHuman,它已经知道你昨晚收到了什么邮件、GitHub 上有什么新 Issue、Slack 里有什么新消息。你不需要「喂」它信息,它自己就吃饱了。
OpenHuman 支持自动模型路由:简单任务走轻量快速模型,复杂推理走重型模型,需要看图走视觉模型。用户不需要手动切换,一个订阅覆盖所有路由。
如果你更在意隐私,它也支持通过 Ollama 接入本地模型。不过说实话,在 118 个数据源的场景下,纯本地模型的体验还是有差距的。
OpenHuman 不是命令行工具,它有一个桌面小角色(Mascot),默认休眠,鼠标悬停或点击唤醒。它会说话、会对环境做出反应、会在后台「思考」。它甚至可以加入 Google Meet 作为真实参与者——这个功能挺有想象空间,虽然目前还在打磨中。
OpenHuman 的技术栈有一个明显的特点:Rust 为主力,TypeScript 做 UI 层。这跟当前大多数 AI Agent 框架(Python 为主)形成了鲜明差异。
| 桌面框架 | Tauri + CEF(Chromium Embedded Framework) |
| 核心语言 | Rust 70.1%(Agent 核心、记忆引擎、压缩) |
| UI 层 | TypeScript 25.7%(Web UI + 交互逻辑) |
| 本地存储 | SQLite(记忆树 + 结构化数据) |
| 知识库格式 | Obsidian 兼容 Markdown(双向可编辑) |
| 语音 | STT 识别输入 + ElevenLabs TTS 输出 + 口型同步 |
| 本地模型 | 通过 Ollama 接入(可选) |
| 构建系统 | pnpm workspace monorepo |
选 CEF 而不是 Electron 是个有意思的决定。CEF 比 Electron 更轻量,内存占用更小,这也符合 OpenHuman「本地优先、轻量化」的定位。但代价是生态不如 Electron 丰富,前端兼容性需要注意(目前只支持 Chrome 134+)。
Rust 写核心逻辑也是同样的思路——性能好、内存安全、可以跑在高频轮询和大量数据压缩的场景。1,817 次提交的代码量,用 Rust 来写确实更有底气。
OpenHuman 说是 UI-first,安装确实简单。有两条路:
去 tinyhumans.ai/openhuman 下载 DMG(macOS)或 EXE(Windows),装好打开就行。这是大多数人的选择。
# macOS / Linux
curl -fsSL https://raw.githubusercontent.com/tinyhumansai/openhuman/main/scripts/install.sh | bash
# Windows
irm https://raw.githubusercontent.com/tinyhumansai/openhuman/main/scripts/install.ps1 | iex
如果你想改代码或者贡献,前置依赖比较重:
# 需要 Node.js 24+、pnpm 10.10.0、Rust 1.93.0、CMake
git clone https://github.com/tinyhumansai/openhuman.git
cd openhuman
git submodule update --init --recursive
pnpm install
# 仅启动 Web UI
pnpm dev
# 启动完整桌面应用
pnpm --filter openhuman-app dev:app
说实话这个依赖要求不低——Node 24 和 Rust 1.93 都是相当新的版本。不过作为 Beta 阶段的项目,这可以理解。正式版应该会提供更成熟的一键安装体验。
OpenHuman 的定位很独特——它不是 AI 编程工具(像 Claude Code、Cline),也不是单纯的本地模型管理器(像 Ollama、LM Studio),更不是通用 LLM 网关(像 OpenRouter、LiteLLM)。它是一个「上层 Agent 框架」:你给它接上模型,它负责在模型之上构建有记忆、有技能、有交互的 agent 体验。
| 维度 | OpenHuman | OpenClaw | Hermes Agent | Claude Code |
|---|---|---|---|---|
| 开源 | ✓ GPL-3.0 | ✓ MIT | ✓ MIT | ✗ 闭源 |
| 上手难度 | UI-first,几分钟 | ⚠ 终端优先 | ⚠ 终端优先 | ✓ CLI 简单 |
| 记忆系统 | Memory Tree + Obsidian | ⚠ 依赖插件 | FTS5 自学习 | ✓ 对话级记忆 |
| 第三方集成 | 118+ OAuth 一键 | ⚠ BYO | ⚠ BYO | ⚠ 少量 |
| 自动数据拉取 | ✓ 20 分钟轮询 | ✗ 无 | ✗ 无 | ✗ 无 |
| Token 压缩 | ✓ TokenJuice | ✗ 无 | ✗ 无 | ✗ 无 |
| 模型路由 | ✓ 内置自动路由 | ⚠ 手动配置 | ✓ OpenRouter | ✗ 固定模型 |
| 本地部署 | ✓ Ollama 可选 | ✓ 完全本地 | ✓ 可选本地 | ✗ 纯云端 |
| 桌面体验 | ✓ Mascot + GUI | ✗ 终端 | ✗ 终端 | ⚠ 终端/IDE |
| 核心场景 | 个人 AI 助手 | 全能 Agent 平台 | 自学习 Agent | 编程开发 |
从表格里能看出来,OpenHuman 在「集成数量」和「冷启动速度」两个维度上有明显优势。但它牺牲了一些东西——GPL-3.0 许可证比 MIT 更严格(意味着你不能把它的代码闭源商业化),而且它目前不支持 15+ 消息平台接入(Hermes Agent 的强项)。
更关键的一点:OpenHuman 和 Ollama 不是竞品。OpenHuman 是跑在 Ollama 上面的上层框架。你可以理解为 Ollama 负责跑模型,OpenHuman 负责在模型之上构建 agent 体验。
说实话,最大的风险是「太新了」。3 个月的项目,GPL-3.0 许可证,单人维护(从提交记录看主要贡献者集中在极少数人)——这些都是红旗。但同时,它的设计思路确实比很多「成熟」项目更清晰。Memory Tree 的想法如果真的能落地,对整个 AI Agent 赛道都有启发。
博主观点:OpenHuman 解决了一个真实痛点——AI 助手的「冷启动」和「遗忘」问题。118+ 应用集成 + 自动同步 + Obsidian 级知识库的思路,比我评测过的任何 Agent 框架都更接近「真正的个人 AI 助手」。但它才 3 个月,GPL-3.0 许可证也可能限制商业生态发展。我的建议是:先 Star 关注,等 v1.0 再考虑日常使用。如果你已经是 Obsidian 重度用户,那它值得现在就开始体验——因为它的记忆系统和你的知识库是无缝对接的。