Google Chrome 团队核心工程师 Addy Osmani 出品,把二十年的 Google 工程实践编译成 AI 代理不可跳过的结构化工作流。20 个核心技能、7 条斜杠命令、3 个专家角色,从「有个想法」到「部署上线」的全链路覆盖。
Agent Skills 不是一个工具,也不是一个框架。它是一套用 Markdown 写的工程纪律,装进 AI 编码代理的脑子里,让它们像 Google 的 Senior Staff Engineer 一样干活。
项目创建于 2026 年 2 月 15 日,作者 Addy Osmani 是 Google Chrome 团队的前端性能负责人,也是《Learning JavaScript Design Patterns》和《Image Optimization》的作者。他在 Google 待了十几年,把《Software Engineering at Google》这本书里的方法论,加上自己踩过的坑,浓缩成了 20 个 SKILL.md 文件。
项目上线不到三个月就拿了 3.3 万 Star,今天单日增长 3,062 个,在 GitHub Trending 榜上排第二(仅次于连续霸榜的 DeepSeek-TUI)。更重要的是,它的 Fork 数只有 3,810——说明大量用户不是围观,是真的在用。
用过 Claude Code、Cursor、Windsurf 的人都经历过这个场景:你让 AI 写一个功能,它写得很快,代码也能跑。但仔细一看——没有测试、没有边界处理、提交信息是 "update code"、PR 描述是 "fix bug"。
这不是 AI 的能力问题,是 AI 的优化目标问题。AI 编码代理被训练的目标是「让用户满意」,而大多数用户满意的定义是「代码能跑」。至于测试覆盖、安全审计、向后兼容、提交规范——这些是工程问题,不是功能问题,AI 默认不会主动做。
Agent Skills 解决的不是「让 AI 写得更好」,而是「让 AI 像工程师一样写代码」。它把代码审查、测试驱动、安全加固这些工程实践,从「可选建议」变成了「不可跳过的流程」。
这个区别很关键。你可以给 AI 写一个 system prompt 说「请写测试」,但它会不会写、写得对不对、什么时候跳过——你控制不了。Agent Skills 的做法是给每个工程实践配一套完整的剧本:什么时候触发、按什么步骤执行、怎么判断完成了、如果 AI 试图跳过该怎么反驳。
Agent Skills 把软件开发分成六个阶段,对应七条斜杠命令:
还有一条 /code-simplify 命令可以随时调用,专门对付 AI 最容易犯的毛病——过度工程化。
| 阶段 | 技能 | 做什么 |
|---|---|---|
| Define | idea-refine | 把模糊想法变成具体方案,结构化发散/收敛 |
| spec-driven-development | 先写 PRD 再写代码,目标、边界、风格、测试策略全部提前定义 | |
| Plan | planning-and-task-breakdown | 把 PRD 拆成小而可验证的任务,带验收标准和依赖排序 |
| Build | incremental-implementation | 薄垂直切片开发,功能开关、安全默认值、回滚友好 |
| test-driven-development | 红-绿-重构,测试金字塔 80/15/5,DAMP 优于 DRY | |
| context-engineering | 在正确的时间给 AI 正确的上下文,减少幻觉 | |
| source-driven-development | 框架决策必须基于官方文档,引用来源 | |
| frontend-ui-engineering | 组件架构、设计系统、WCAG 2.1 AA 无障碍 | |
| api-and-interface-design | 契约优先、Hyrum's Law、错误语义、边界验证 | |
| Verify | browser-testing-with-devtools | Chrome DevTools MCP 实时获取 DOM、网络、性能数据 |
| debugging-and-error-recovery | 五步排查法:复现→定位→缩减→修复→防护 | |
| Review | code-review-and-quality | 五轴审查,变更控制在 ~100 行,严重性分级 |
| code-simplification | Chesterton's Fence,500 规则,降低复杂度但保持行为 | |
| security-and-hardening | OWASP Top 10、认证模式、密钥管理、三层边界 | |
| performance-optimization | Core Web Vitals 目标、先测量再优化、反模式检测 | |
| Ship | git-workflow-and-versioning | 主干开发、原子提交、提交作为保存点 |
| ci-cd-and-automation | 左移、质量门控、特性开关、失败反馈循环 | |
| deprecation-and-migration | 代码即负债,强制性 vs 建议性弃用,僵尸代码清理 | |
| documentation-and-adrs | 架构决策记录、API 文档、记录「为什么」 | |
| shipping-and-launch | 上线检查清单、分阶段 rollout、回滚程序、监控 |
不是参考文档,是执行剧本。每个 SKILL.md 包含六个标准模块:
最后两项是关键。Verification 确保每一步都有可验证的退出条件(跑什么命令、看什么输出),而不是 AI 说「搞定了」就算搞定。Rationalizations 是整个项目最精巧的设计——后面单开一节讲。
AI 编码代理有一个很难对付的行为模式:它们太容易被说服跳过步骤。你说「先别写测试,先把功能做完」,AI 会说「好的,没问题」。你说「这个内部工具不用考虑安全」,AI 会说「明白,跳过安全检查」。
传统的 system prompt 解决不了这个问题,因为你无法穷举所有可能的跳步借口。Agent Skills 的做法是在每个技能里预置一张「合理化表」——把 AI 常用的跳步借口和对应的反驳全部列出来。
核心思路:当用户试图让 AI 跳过某个步骤时,AI 不再默默照做,而是用预置的反驳来回应用户。这不是跟用户对着干,而是像老工程师一样提醒你「你确定?」
举几个真实的例子:
| 常见跳步借口 | Agent Skills 的反驳 |
|---|---|
| 「测试拖慢速度,先出功能再说」 | 「除错时间是测试时间的 3-5 倍。你现在省的每一分钟,后面都要用五分钟还。」 |
| 「这个变更太小,不用走完整流程」 | 「任何变更都应该遵循工作流。小变更出问题的概率不比大变更低。」 |
| 「我们是内部工具,安全要求没那么高」 | 「内部工具泄漏生产凭据的案例每月都在发生。安全不是可选的。」 |
| 「input validation 等上线前再加」 | 「开发中期加最省事,上线前加漏洞最多。你大概率会忘。」 |
| 「这个 prototype 不会进生产」 | 「统计显示 70% 的 prototype 最终进了生产。按生产标准写。」 |
这个机制的效果很直观:团队实测数据显示,使用 Agent Skills 后 PR 包含测试的比率从 23% 提升到 81%,一次 Commit 变更行数从平均 380 行降到 95 行。AI 不再是那个「你说什么就做什么」的应声虫,而是变成了一个有自己的工程判断、会在关键时刻拉你一把的搭档。
除了 20 个全流程技能,Agent Skills 还提供了三个专家角色的 persona,可以在代码审查、测试设计、安全审计时切换不同的视角:
以 Google Staff Engineer 的标准做五轴代码审查:正确性、可读性、可维护性、性能、安全性。核心评判标准:「Staff 工程师会批准这个 PR 吗?」
QA 专家视角,关注测试策略、覆盖率分析、Prove-It 模式。不只检查「有没有测试」,更检查「测试能不能真正证明代码是对的」。
安全工程师视角,做漏洞检测、威胁建模、OWASP Top 10 评估。处理用户输入、认证、数据存储时自动激活。
Claude Code 有官方 marketplace 支持,体验最完整。安装只需两条命令:
/plugin marketplace add addyosmani/agent-skills
/plugin install agent-skills@addy-agent-skills
安装后可以直接用七条斜杠命令触发完整流程,比如:
/spec # 先定义需求
/plan # 再分解任务
/build # 然后增量实现
/test # 跑测试验证
/review # 代码审查
/ship # 部署上线
把 SKILL.md 文件复制到项目的 .cursor/rules/ 目录即可。可以复制单个技能,也可以引用整个 skills/ 目录。
gemini skills install https://github.com/addyosmani/agent-skills.git --path skills
| 工具 | 集成方式 |
|---|---|
| Windsurf | 技能内容加入 rules 配置 |
| GitHub Copilot | agents/ 定义作为角色,技能放入 .github/copilot-instructions.md |
| Kiro IDE | 技能放在 .kiro/skills/ 目录 |
| OpenCode | 通过 AGENTS.md 和 skill 工具使用 |
| 任何支持 system prompt 的 Agent | 技能是纯 Markdown,直接作为指令文件使用 |
注意:Claude Code 的体验最完整(有 marketplace + slash commands + 自动触发),其他工具需要手动配置,便利性稍差。项目 83 天历史、73 个 Open Issues 说明还在快速迭代中,生产环境建议锁定特定版本 tag。
以下数据来自社区实测报告,对照组为相同团队在未使用 Agent Skills 时的基线数据:
| 指标 | 未使用 Agent Skills | 使用后 | 变化 |
|---|---|---|---|
| 单元测试覆盖率 | 18% | 67% | +272% |
| PR 包含测试的比率 | 23% | 81% | +252% |
| 一次 Commit 变更行数 | ~380 行 | ~95 行 | -75% |
| Review 轮次中位数 | 4.2 轮 | 1.8 轮 | -57% |
| 提交信息规范性 | 31% | 88% | +184% |
Commit 变更行数从 380 降到 95 这个数据尤其值得注意。这不是说 AI 写得更少了,而是它在按照增量开发的节奏工作——每次改一小块、测试通过、再改下一块。Review 轮次从 4.2 降到 1.8 也说明了同样的问题:代码质量提高了,审查的来回减少了。
| 维度 | Agent Skills | Awesome Claude Code | obra/superpowers | Anthropic 官方 Skills |
|---|---|---|---|---|
| 定位 | 工程规范工作流 | 资源清单 | Claude Code 技能包 | 官方范例 |
| Stars | 33K | — | — | — |
| 技能数量 | 20 + 3 角色 + 4 检查清单 | N/A | ~10 | 若干范例 |
| 流程覆盖 | 完整(Define→Ship) | 无流程 | 部分 | 单技能示范 |
| 反合理化 | 每个技能都有 | 无 | 无 | 无 |
| Verification 机制 | 每个技能都有退出条件 | 无 | 部分 | 有 |
| 多 Agent 兼容 | 8 种工具 | Claude Code | Claude Code | Claude 专属 |
| Skill 格式规范 | 标准化 SKILL.md | 纯 Markdown | Markdown | 官方 SKILL.md |
| 设计哲学 | 工程纪律 > 代码能力 | 资源聚合 | 增强能力 | 教学示范 |
Agent Skills 的差异化很明确:它不教 AI 写更好的代码,而是让 AI 按照工程规范写代码。Awesome Claude Code 是个资源列表,没有工作流;superpowers 偏向增强 AI 的能力(比如更好的文件操作),但不涉及工程纪律;Anthropic 官方 Skills 是平台教学,和 Osmani 的生产实践定位不冲突。
和这些竞品比,Agent Skills 最独特的地方是两点:一是完整的生命周期覆盖(从 idea 到 production),二是反合理化机制。前者让你不用东拼西凑,后者解决了 AI 编码代理最大的软肋。
如果你正在用 AI 编码代理做正经的项目(不是写一次性的脚本),Agent Skills 是目前最好的工程纪律工具。它解决的不是 AI 不会写代码的问题,而是 AI 写的代码能不能放心用的问题。安装成本几乎为零,收益立竿见影。
推荐的使用策略:个人开发者直接全量安装;团队环境建议从 /review 和 /test 两个技能开始,建立共识后再逐步扩大。AI 编码工具的时代,工程规范不是束缚,而是让 AI 的能力真正可用的前提。