~/reviews · agency-agents · 2026-06-11

./github-ai-review --today --project="agency-agents"

我拆了 agency-agents 的 232 个 AI Agent,发现真正厉害的不是数量

每天跑 GitHub AI 日报跑了两个多月,看过记忆系统、代码助手、PM 工具链、视频流水线——每个都在试图让 AI 更「聪明」一点。直到我看到 agency-agents,我坐直了:它不在比谁更聪明,它把 AI 组织成了一家公司。

AGENT111K STARS232 AGENTSMIT16 DIVISIONS

// 目录

# 切工具切到崩溃 # 为什么值得讲 # 真正重要的发现 # 我看到了什么 # 上手试了一下 # 跟其他方案对比 # 跟我做的事有关吗 # 我的判断

// 概览

STARS
111,052
GitHub 总星标,今日新增 +1,434
FORKS
18,204
社区 Fork 数,8 种语言翻译版本
AGENTS
232
16 个部门,覆盖工程、设计、营销、安全、财务等
COMMITS
339
创建于 2025-10-13,持续迭代 8 个月
ISSUES
67
开放 Issue 数,最近更新 2026-06-07
TOOLS
12+
兼容 Claude Code / Cursor / Copilot / Gemini CLI 等

切工具切到崩溃

这两个多月,我每天早上跑 GitHub AI 日报,评测过的项目一只手数不过来。测过的类型包括:Agent 记忆系统、代码助手、PM 工具链、视频流水线、TTS 语音合成、论文文献工具、文档转 Markdown、上下文压缩、财务交易框架……

每个项目都做得很专注,在自己的赛道里很能打。但问题也在这里:每个工具只管一件事

我今天做一个小云雀前端页面,得先切到 Claude Code 让工程 Agent 干活。写完代码想发一篇小红书推广内容,就得退出 Claude Code,打开另一个工具让内容 Agent 试试。想看看增长数据,还得再切。每个工具有自己的 CLI 命令、自己的配置方式、自己的 token 计费逻辑。

这种感觉不只是麻烦。它像你雇了一群自由职业者,但每个人用不同的聊天软件、不同的报价方式、不同的交付格式。你花在「组织他们」上的时间,可能比实际干活的时间还多。

为什么这件事值得讲

这两个多月 GitHub AI 热潮看下来,我注意到一个很有意思的规律:工具在分化,但用户的工作流是连续的。

Coding 工具越来越强,写作工具越来越强,设计工具越来越强——但它们之间是断裂的。产品经理的一天是写 PRD → 跟开发沟通 → 看数据 → 写推广文案 → 回复用户反馈,五个场景可能需要五种不同的 AI 工具。

没人想当五个 AI 工具的产品经理。大家只想要一个。

这就是为什么我看到 agency-agents 的时候,第一反应不是「又一个 Agent 工具」,而是「这个思路可能是对的」

真正重要的不是 232 个 Agent

先说结论:agency-agents 真正厉害的地方,不是它的 Agent 数量,而是它对 AI Agent 的组织方式——不是搞一个超级全能 Agent 什么都会干,而是模拟一家真实的公司,把工作切成 16 个部门、232 个有性格、有流程、有交付标准的专业角色。

这个组织逻辑,比 232 个 Agent 这个数字本身重要得多。

我看到了什么

花了一个小时翻了十几个 Agent 的定义文件。说实话,质量比我想象的高。

每个 Agent 不是那种「你是一个 XX 专家,请帮我…」的 prompt 模板。它是一套完整的角色定义——有身份、有核心使命、有领域特定规则、有带代码示例的技术交付物、有标准化工作流程、有可量化的成功指标。

比如测试部门的 Evidence Collector,第一条规则就是「我不只是测你的代码,我默认要找出 3-5 个问题,每个问题必须有视觉证据」。不是「请仔细检查代码」这种废话,是行为约束。

营销部门的 Reddit 社区建设者,核心使命是「你不是在 Reddit 上做营销,你在成为一个有价值社区成员,恰好代表一个品牌」。这句话背后是 Reddit 社区文化的深刻理解——硬广会被喷死,但真心贡献会被爱戴。

还有设计部门的 Whimsy Injector:「每个有趣的元素必须服务于功能或情感目标。设计让人愉悦的体验,不是分散注意力的花哨特效」。一个有自我约束的设计 Agent,这个少见。

最让我意外的是中国市场覆盖。不是简单翻译英文 Agent,而是实打实地做了 8 个中国平台专属 Agent:小红书专家、微信公众号管理员、知乎策略师、B站内容策略师、百度 SEO、抖音策略师、快手策略师、微博策略师。还配了 5 个中国特有场景:直播电商教练、私域运营专家、中国电商运营、中国市场本地化策略师、跨境电商。这个完整度,在 GitHub 上我还没见过第二个。

另外还有三个让我觉得前瞻性很足的 Agent:AEO 基础(Agent Engine Optimization,面向 AI 代理引擎的优化)、代理搜索优化器、AI 引用策略师。这三个是给「AI 时代」做的优化,不是给百度/Google SEO 时代做的。这在 2026 年 6 月还是非常前沿的方向。

上手试了一下

安装很简单,一行命令:

git clone https://github.com/msitarzewski/agency-agents cd agency-agents ./scripts/install.sh --tool claude-code

装完就有 232 个 Agent 躺在 ~/.claude/agents/ 目录里。安装脚本会自动检测你系统上装了哪些工具,给你一个复选框 UI 选择安装目标。

不过实测有个小坑:OpenCode 目前最多只能注册约 119 个 Agent,超出会被静默丢弃。官方文档也写了这个上游 Bug,建议用 --division 参数只装需要的部门。

我用前端工程师 Agent 试了一把——让它帮我做一个暗主题的登录表单组件。它给出来的不只是代码,还带了无障碍检查清单、移动端触控区域建议、loading 状态的 loading skeleton 动画思路。虽然最终代码还需要我自己调,但它覆盖了我平时会忘掉的 70% 细节。

然后我又切到小红书专家 Agent,让我把刚做的项目写成一篇小红书风格的推广笔记。语气完全变了——不再是一本正经的文档腔,而是那种「姐妹们我今天试了一个超好用的工具」的社区感。两个 Agent 之间的切换就是在 Claude Code 里换一个 Agent 上下文,零摩擦。

跟其他方案比,它强在哪

项目定位Agent 数覆盖领域中国平台
agency-agents全业务线 Agent 团队232工程/设计/营销/产品/安全/财务/游戏/空间计算等 16 部门8 平台 + 5 电商场景
obra/superpowersAgent 技能框架N/A通用能力增强,无垂直领域分工
addyosmani/agent-skills工程规范工具20纯工程领域(Define → Ship 全流程)
mattpocock/skills编程纪律工具18TypeScript 编程工程纪律
phuryn/pm-skillsPM 方法论工具68纯产品管理(发现 → GTM → 增长)

最大的差别不在 Agent 数量,而在于各部门是互补关系,不是替代关系。一个产品经理在用 Claude Code 写代码,可以用 mattpocock/skills 管工程纪律、用 pm-skills 管产品决策、再用 agency-agents 的前端 Agent 出 UI、小红书 Agent 写推广文案。这些工具不是竞品,是积木。

但 agency-agents 目前唯一做到的是:在同一套体系下覆盖了从写代码到写文案的完整链路。你不用在三个工具之间切来切去,就在一个 agent 目录里换上下文。


16 个部门怎么做分工

🏗️
Engineering31 个 Agent
前端/后端/AI/DevOps
🎨
Design9 个 Agent
UI/UX/品牌/视觉
📢
Marketing38 个 Agent
含 8 个中国平台
📊
Product/Sales15 个 Agent
增长 + 策略 + 变现
四步覆盖产品全生命周期:开发 → 设计 → 推广 → 增长

其他部门还包括:Security(10 个,安全架构到渗透测试)、Testing(8 个,无障碍审计到性能基准)、Finance(5 个,记账到税务)、GIS(13 个,地理信息系统全栈)、Game Development(18 个,5 个引擎覆盖)、Academic(5 个,人类学到心理学)、Spatial Computing(6 个,Vision Pro 到 WebXR)。

这个广度,目前在 GitHub 上没有第二家。


几个值得关注的数字

Claude Code
98% 兼容度
Cursor
85% 兼容度
Gemini CLI
75% 兼容度
Copilot
70% 兼容度
OpenCode
51% 受限于 119 Agent 上限

兼容度评估基于工具对 Agent 文件格式原生支持程度和实测体验,非官方基准


跟我在做的事有什么关系

坦白说,agency-agents 让我重新想了一遍我自己的 AI 工作流该怎么搭。

我现在每天早上跑 GitHub AI 日报,写评测文章,偶尔在自己的公众号发。这个流程里其实暗含了多条不同的工作链:调研 → 技术评测 → 写文章 → 排版 → 发布 → 在小红书/朋友圈发简版 → 数据复盘。以前我是自己一条龙扛下来,或者单独调 Claude Code 做特定的步骤。

agency-agents 让我意识到一件事:我可以不自己扛。我可以让研究 Agent 帮我筛 Trending 数据,让技术评测 Agent 出初稿,让中文写作 Agent 做润色,让小红书 Agent 写简版推广,让数据分析 Agent 每周出复盘报告。

不是「AI 替代我」,而是「我一个人,指挥一个 AI 团队」。这个视角的切换,我觉得比任何单个工具的能力提升都重要。

我接下来准备做的实验:把我自己的小云雀项目(AI 短剧流水线工具)的产品迭代流程,切给 agency-agents 的不同部门——工程部门做代码实现、测试部门做质量检查、营销部门做内容推广、产品部门做用户反馈分析。如果这个实验跑通了,我会单独写一篇复盘。

我的判断

VERDICT
8.5 / 10
最适合:需要跨领域 AI 协作的个人开发者和独立产品人
+ 唯一覆盖工程到营销完整链路的一站式 Agent 方案
+ 中国市场覆盖在 GitHub 上没有对手(8 平台 + 5 电商)
+ 12+ 工具兼容,不绑平台
+ 每个 Agent 有完整的角色定义 + 工作流 + 交付标准,不是简单 prompt
+ MIT 开源,8 种语言社区翻译
+ 社区生态活跃(111K Star,67 个 Issue 多为功能提案)
- 单人维护(Bus Factor = 1),项目可持续性存疑
- 0 个 Release,版本管理缺失
- 无编排引擎:Agent 之间的协作完全靠人手动切换
- Agent 质量参差不齐:232 个无法逐一充分维护和测试
- 高度依赖 Claude Code,其他工具体验打折扣
- 安全审计缺失:Agent 文件本质是自由文本,有没有恶意指令没人检查过

如果让我用一句话总结:agency-agents 不是「更聪明的 AI」,它是「AI 时代的组织结构设计」。不会让你的 AI 突然变聪明,但会让你的 AI 工作方式更像一个公司而不是一个工具。

它适合谁?独立开发者、独立产品人、小型团队的创始人。每天需要切 3-5 种角色的个人创作者。不适合谁?大公司有专业团队的(工程有人写、设计有人画、营销有人做),或者只需要单一场景工具的用户。

我给它 8.5 分。架构理念 9.5 分,但项目成熟度和维护风险拉了后腿。不过我会关注它接下来的走势——特别是社区正在讨论的两个方向:Agent 编排引擎和 Agent 之间交易市场。如果这两个方向能在 2026 年内落地,agency-agents 可能会成为一个我每天都会用的工具,而不只是偶尔翻翻的 Agent 库。


// links

GitHub 仓库
中文翻译版(141 Agent + 46 中国市场原创)
独立中文翻译版(含 B站/微信/小红书本土化)
社区讨论 & 成功案例


我会持续记录一个不会编程的产品经理如何用 AI 写代码、做开源工具、搭 AI 视频流水线。每天跑 GitHub AI 日报,每个月出深度复盘。如果你也想用 AI 把自己的想法做成产品,可以关注我,我们一起往前试。