~/reviews · agency-agents · 2026-06-11

./github-ai-review --today --project="agency-agents"

我拆了 agency-agents 的 232 个 AI Agent，发现真正厉害的不是数量

每天跑 GitHub AI 日报跑了两个多月，看过记忆系统、代码助手、PM 工具链、视频流水线——每个都在试图让 AI 更「聪明」一点。直到我看到 agency-agents，我坐直了：它不在比谁更聪明，它把 AI 组织成了一家公司。

AGENT111K STARS232 AGENTSMIT16 DIVISIONS

// 目录

# 切工具切到崩溃 # 为什么值得讲 # 真正重要的发现 # 我看到了什么 # 上手试了一下 # 跟其他方案对比 # 跟我做的事有关吗 # 我的判断

// 概览

STARS

111,052

GitHub 总星标，今日新增 +1,434

FORKS

18,204

社区 Fork 数，8 种语言翻译版本

AGENTS

232

16 个部门，覆盖工程、设计、营销、安全、财务等

COMMITS

339

创建于 2025-10-13，持续迭代 8 个月

ISSUES

开放 Issue 数，最近更新 2026-06-07

TOOLS

12+

兼容 Claude Code / Cursor / Copilot / Gemini CLI 等

切工具切到崩溃

这两个多月，我每天早上跑 GitHub AI 日报，评测过的项目一只手数不过来。测过的类型包括：Agent 记忆系统、代码助手、PM 工具链、视频流水线、TTS 语音合成、论文文献工具、文档转 Markdown、上下文压缩、财务交易框架……

每个项目都做得很专注，在自己的赛道里很能打。但问题也在这里：每个工具只管一件事。

我今天做一个小云雀前端页面，得先切到 Claude Code 让工程 Agent 干活。写完代码想发一篇小红书推广内容，就得退出 Claude Code，打开另一个工具让内容 Agent 试试。想看看增长数据，还得再切。每个工具有自己的 CLI 命令、自己的配置方式、自己的 token 计费逻辑。

这种感觉不只是麻烦。它像你雇了一群自由职业者，但每个人用不同的聊天软件、不同的报价方式、不同的交付格式。你花在「组织他们」上的时间，可能比实际干活的时间还多。

为什么这件事值得讲

这两个多月 GitHub AI 热潮看下来，我注意到一个很有意思的规律：工具在分化，但用户的工作流是连续的。

Coding 工具越来越强，写作工具越来越强，设计工具越来越强——但它们之间是断裂的。产品经理的一天是写 PRD → 跟开发沟通 → 看数据 → 写推广文案 → 回复用户反馈，五个场景可能需要五种不同的 AI 工具。

没人想当五个 AI 工具的产品经理。大家只想要一个。

这就是为什么我看到 agency-agents 的时候，第一反应不是「又一个 Agent 工具」，而是「这个思路可能是对的」。

真正重要的不是 232 个 Agent

先说结论：agency-agents 真正厉害的地方，不是它的 Agent 数量，而是它对 AI Agent 的组织方式——不是搞一个超级全能 Agent 什么都会干，而是模拟一家真实的公司，把工作切成 16 个部门、232 个有性格、有流程、有交付标准的专业角色。

这个组织逻辑，比 232 个 Agent 这个数字本身重要得多。

我看到了什么

花了一个小时翻了十几个 Agent 的定义文件。说实话，质量比我想象的高。

每个 Agent 不是那种「你是一个 XX 专家，请帮我…」的 prompt 模板。它是一套完整的角色定义——有身份、有核心使命、有领域特定规则、有带代码示例的技术交付物、有标准化工作流程、有可量化的成功指标。

比如测试部门的 Evidence Collector，第一条规则就是「我不只是测你的代码，我默认要找出 3-5 个问题，每个问题必须有视觉证据」。不是「请仔细检查代码」这种废话，是行为约束。

营销部门的 Reddit 社区建设者，核心使命是「你不是在 Reddit 上做营销，你在成为一个有价值社区成员，恰好代表一个品牌」。这句话背后是 Reddit 社区文化的深刻理解——硬广会被喷死，但真心贡献会被爱戴。

还有设计部门的 Whimsy Injector：「每个有趣的元素必须服务于功能或情感目标。设计让人愉悦的体验，不是分散注意力的花哨特效」。一个有自我约束的设计 Agent，这个少见。

最让我意外的是中国市场覆盖。不是简单翻译英文 Agent，而是实打实地做了 8 个中国平台专属 Agent：小红书专家、微信公众号管理员、知乎策略师、B站内容策略师、百度 SEO、抖音策略师、快手策略师、微博策略师。还配了 5 个中国特有场景：直播电商教练、私域运营专家、中国电商运营、中国市场本地化策略师、跨境电商。这个完整度，在 GitHub 上我还没见过第二个。

另外还有三个让我觉得前瞻性很足的 Agent：AEO 基础（Agent Engine Optimization，面向 AI 代理引擎的优化）、代理搜索优化器、AI 引用策略师。这三个是给「AI 时代」做的优化，不是给百度/Google SEO 时代做的。这在 2026 年 6 月还是非常前沿的方向。

上手试了一下

安装很简单，一行命令：

git clone https://github.com/msitarzewski/agency-agents cd agency-agents ./scripts/install.sh --tool claude-code

装完就有 232 个 Agent 躺在 ~/.claude/agents/ 目录里。安装脚本会自动检测你系统上装了哪些工具，给你一个复选框 UI 选择安装目标。

不过实测有个小坑：OpenCode 目前最多只能注册约 119 个 Agent，超出会被静默丢弃。官方文档也写了这个上游 Bug，建议用 --division 参数只装需要的部门。

我用前端工程师 Agent 试了一把——让它帮我做一个暗主题的登录表单组件。它给出来的不只是代码，还带了无障碍检查清单、移动端触控区域建议、loading 状态的 loading skeleton 动画思路。虽然最终代码还需要我自己调，但它覆盖了我平时会忘掉的 70% 细节。

然后我又切到小红书专家 Agent，让我把刚做的项目写成一篇小红书风格的推广笔记。语气完全变了——不再是一本正经的文档腔，而是那种「姐妹们我今天试了一个超好用的工具」的社区感。两个 Agent 之间的切换就是在 Claude Code 里换一个 Agent 上下文，零摩擦。

跟其他方案比，它强在哪

项目	定位	Agent 数	覆盖领域	中国平台
agency-agents	全业务线 Agent 团队	232	工程/设计/营销/产品/安全/财务/游戏/空间计算等 16 部门	8 平台 + 5 电商场景
obra/superpowers	Agent 技能框架	N/A	通用能力增强，无垂直领域分工	无
addyosmani/agent-skills	工程规范工具	20	纯工程领域（Define → Ship 全流程）	无
mattpocock/skills	编程纪律工具	18	TypeScript 编程工程纪律	无
phuryn/pm-skills	PM 方法论工具	68	纯产品管理（发现 → GTM → 增长）	无

最大的差别不在 Agent 数量，而在于各部门是互补关系，不是替代关系。一个产品经理在用 Claude Code 写代码，可以用 mattpocock/skills 管工程纪律、用 pm-skills 管产品决策、再用 agency-agents 的前端 Agent 出 UI、小红书 Agent 写推广文案。这些工具不是竞品，是积木。

但 agency-agents 目前唯一做到的是：在同一套体系下覆盖了从写代码到写文案的完整链路。你不用在三个工具之间切来切去，就在一个 agent 目录里换上下文。

16 个部门怎么做分工

🏗️

Engineering31 个 Agent
前端/后端/AI/DevOps

→

🎨

Design9 个 Agent
UI/UX/品牌/视觉

→

📢

Marketing38 个 Agent
含 8 个中国平台

→

📊

Product/Sales15 个 Agent
增长 + 策略 + 变现

四步覆盖产品全生命周期：开发 → 设计 → 推广 → 增长

其他部门还包括：Security（10 个，安全架构到渗透测试）、Testing（8 个，无障碍审计到性能基准）、Finance（5 个，记账到税务）、GIS（13 个，地理信息系统全栈）、Game Development（18 个，5 个引擎覆盖）、Academic（5 个，人类学到心理学）、Spatial Computing（6 个，Vision Pro 到 WebXR）。

这个广度，目前在 GitHub 上没有第二家。

几个值得关注的数字

Claude Code

98% 兼容度

Cursor

85% 兼容度

Gemini CLI

75% 兼容度

Copilot

70% 兼容度

OpenCode

51% 受限于 119 Agent 上限

兼容度评估基于工具对 Agent 文件格式原生支持程度和实测体验，非官方基准

跟我在做的事有什么关系

坦白说，agency-agents 让我重新想了一遍我自己的 AI 工作流该怎么搭。

我现在每天早上跑 GitHub AI 日报，写评测文章，偶尔在自己的公众号发。这个流程里其实暗含了多条不同的工作链：调研 → 技术评测 → 写文章 → 排版 → 发布 → 在小红书/朋友圈发简版 → 数据复盘。以前我是自己一条龙扛下来，或者单独调 Claude Code 做特定的步骤。

agency-agents 让我意识到一件事：我可以不自己扛。我可以让研究 Agent 帮我筛 Trending 数据，让技术评测 Agent 出初稿，让中文写作 Agent 做润色，让小红书 Agent 写简版推广，让数据分析 Agent 每周出复盘报告。

不是「AI 替代我」，而是「我一个人，指挥一个 AI 团队」。这个视角的切换，我觉得比任何单个工具的能力提升都重要。

我接下来准备做的实验：把我自己的小云雀项目（AI 短剧流水线工具）的产品迭代流程，切给 agency-agents 的不同部门——工程部门做代码实现、测试部门做质量检查、营销部门做内容推广、产品部门做用户反馈分析。如果这个实验跑通了，我会单独写一篇复盘。

我的判断

VERDICT

8.5 / 10

最适合：需要跨领域 AI 协作的个人开发者和独立产品人

+ 唯一覆盖工程到营销完整链路的一站式 Agent 方案
+ 中国市场覆盖在 GitHub 上没有对手（8 平台 + 5 电商）
+ 12+ 工具兼容，不绑平台
+ 每个 Agent 有完整的角色定义 + 工作流 + 交付标准，不是简单 prompt
+ MIT 开源，8 种语言社区翻译
+ 社区生态活跃（111K Star，67 个 Issue 多为功能提案）

- 单人维护（Bus Factor = 1），项目可持续性存疑
- 0 个 Release，版本管理缺失
- 无编排引擎：Agent 之间的协作完全靠人手动切换
- Agent 质量参差不齐：232 个无法逐一充分维护和测试
- 高度依赖 Claude Code，其他工具体验打折扣
- 安全审计缺失：Agent 文件本质是自由文本，有没有恶意指令没人检查过

如果让我用一句话总结：agency-agents 不是「更聪明的 AI」，它是「AI 时代的组织结构设计」。不会让你的 AI 突然变聪明，但会让你的 AI 工作方式更像一个公司而不是一个工具。

它适合谁？独立开发者、独立产品人、小型团队的创始人。每天需要切 3-5 种角色的个人创作者。不适合谁？大公司有专业团队的（工程有人写、设计有人画、营销有人做），或者只需要单一场景工具的用户。

我给它 8.5 分。架构理念 9.5 分，但项目成熟度和维护风险拉了后腿。不过我会关注它接下来的走势——特别是社区正在讨论的两个方向：Agent 编排引擎和 Agent 之间交易市场。如果这两个方向能在 2026 年内落地，agency-agents 可能会成为一个我每天都会用的工具，而不只是偶尔翻翻的 Agent 库。

// links

GitHub 仓库
 中文翻译版（141 Agent + 46 中国市场原创）
独立中文翻译版（含 B站/微信/小红书本土化）
社区讨论 & 成功案例

我会持续记录一个不会编程的产品经理如何用 AI 写代码、做开源工具、搭 AI 视频流水线。每天跑 GitHub AI 日报，每个月出深度复盘。如果你也想用 AI 把自己的想法做成产品，可以关注我，我们一起往前试。