2026-05-08 GitHub Trending

Agent Skills 深度评测

Google Chrome 团队核心工程师 Addy Osmani 出品,把二十年的 Google 工程实践编译成 AI 代理不可跳过的结构化工作流。20 个核心技能、7 条斜杠命令、3 个专家角色,从「有个想法」到「部署上线」的全链路覆盖。

Addy Osmani / Google Chrome Team ⭐ 33,000 Stars 3,810 Forks 73 Open Issues +3,062 今日新增 Shell / MIT
9.0
综合评分

目录

项目概览

33,000
GitHub Stars
3,810
Forks
73
Open Issues
162
Commits
v0.6.0
最新版本
83天
项目年龄

Agent Skills 不是一个工具,也不是一个框架。它是一套用 Markdown 写的工程纪律,装进 AI 编码代理的脑子里,让它们像 Google 的 Senior Staff Engineer 一样干活。

项目创建于 2026 年 2 月 15 日,作者 Addy Osmani 是 Google Chrome 团队的前端性能负责人,也是《Learning JavaScript Design Patterns》和《Image Optimization》的作者。他在 Google 待了十几年,把《Software Engineering at Google》这本书里的方法论,加上自己踩过的坑,浓缩成了 20 个 SKILL.md 文件。

项目上线不到三个月就拿了 3.3 万 Star,今天单日增长 3,062 个,在 GitHub Trending 榜上排第二(仅次于连续霸榜的 DeepSeek-TUI)。更重要的是,它的 Fork 数只有 3,810——说明大量用户不是围观,是真的在用。

AI Coding Agent 工程规范 Claude Code Cursor Gemini CLI 开源 MIT Google 工程

它解决什么问题

用过 Claude Code、Cursor、Windsurf 的人都经历过这个场景:你让 AI 写一个功能,它写得很快,代码也能跑。但仔细一看——没有测试、没有边界处理、提交信息是 "update code"、PR 描述是 "fix bug"。

这不是 AI 的能力问题,是 AI 的优化目标问题。AI 编码代理被训练的目标是「让用户满意」,而大多数用户满意的定义是「代码能跑」。至于测试覆盖、安全审计、向后兼容、提交规范——这些是工程问题,不是功能问题,AI 默认不会主动做。

Agent Skills 解决的不是「让 AI 写得更好」,而是「让 AI 像工程师一样写代码」。它把代码审查、测试驱动、安全加固这些工程实践,从「可选建议」变成了「不可跳过的流程」。

这个区别很关键。你可以给 AI 写一个 system prompt 说「请写测试」,但它会不会写、写得对不对、什么时候跳过——你控制不了。Agent Skills 的做法是给每个工程实践配一套完整的剧本:什么时候触发、按什么步骤执行、怎么判断完成了、如果 AI 试图跳过该怎么反驳。

核心设计:七条命令 + 二十个技能

开发全生命周期

Agent Skills 把软件开发分成六个阶段,对应七条斜杠命令:

/spec
定义需求
/plan
分解任务
/build
增量实现
/test
验证功能
/review
代码审查
/ship
部署上线

还有一条 /code-simplify 命令可以随时调用,专门对付 AI 最容易犯的毛病——过度工程化。

20 个核心技能分布

阶段技能做什么
Defineidea-refine把模糊想法变成具体方案,结构化发散/收敛
spec-driven-development先写 PRD 再写代码,目标、边界、风格、测试策略全部提前定义
Planplanning-and-task-breakdown把 PRD 拆成小而可验证的任务,带验收标准和依赖排序
Buildincremental-implementation薄垂直切片开发,功能开关、安全默认值、回滚友好
test-driven-development红-绿-重构,测试金字塔 80/15/5,DAMP 优于 DRY
context-engineering在正确的时间给 AI 正确的上下文,减少幻觉
source-driven-development框架决策必须基于官方文档,引用来源
frontend-ui-engineering组件架构、设计系统、WCAG 2.1 AA 无障碍
api-and-interface-design契约优先、Hyrum's Law、错误语义、边界验证
Verifybrowser-testing-with-devtoolsChrome DevTools MCP 实时获取 DOM、网络、性能数据
debugging-and-error-recovery五步排查法:复现→定位→缩减→修复→防护
Reviewcode-review-and-quality五轴审查,变更控制在 ~100 行,严重性分级
code-simplificationChesterton's Fence,500 规则,降低复杂度但保持行为
security-and-hardeningOWASP Top 10、认证模式、密钥管理、三层边界
performance-optimizationCore Web Vitals 目标、先测量再优化、反模式检测
Shipgit-workflow-and-versioning主干开发、原子提交、提交作为保存点
ci-cd-and-automation左移、质量门控、特性开关、失败反馈循环
deprecation-and-migration代码即负债,强制性 vs 建议性弃用,僵尸代码清理
documentation-and-adrs架构决策记录、API 文档、记录「为什么」
shipping-and-launch上线检查清单、分阶段 rollout、回滚程序、监控

每个技能的结构

不是参考文档,是执行剧本。每个 SKILL.md 包含六个标准模块:

Overview — 技能做什么
When to Use — 什么时候触发
Process — 分步执行流程
Rationalizations — 常见借口 + 反驳
Red Flags — 危险信号
Verification — 怎么算完成了

最后两项是关键。Verification 确保每一步都有可验证的退出条件(跑什么命令、看什么输出),而不是 AI 说「搞定了」就算搞定。Rationalizations 是整个项目最精巧的设计——后面单开一节讲。

反合理化机制:为什么它不只是个 checklist

AI 编码代理有一个很难对付的行为模式:它们太容易被说服跳过步骤。你说「先别写测试,先把功能做完」,AI 会说「好的,没问题」。你说「这个内部工具不用考虑安全」,AI 会说「明白,跳过安全检查」。

传统的 system prompt 解决不了这个问题,因为你无法穷举所有可能的跳步借口。Agent Skills 的做法是在每个技能里预置一张「合理化表」——把 AI 常用的跳步借口和对应的反驳全部列出来。

核心思路:当用户试图让 AI 跳过某个步骤时,AI 不再默默照做,而是用预置的反驳来回应用户。这不是跟用户对着干,而是像老工程师一样提醒你「你确定?」

举几个真实的例子:

常见跳步借口Agent Skills 的反驳
「测试拖慢速度,先出功能再说」「除错时间是测试时间的 3-5 倍。你现在省的每一分钟,后面都要用五分钟还。」
「这个变更太小,不用走完整流程」「任何变更都应该遵循工作流。小变更出问题的概率不比大变更低。」
「我们是内部工具,安全要求没那么高」「内部工具泄漏生产凭据的案例每月都在发生。安全不是可选的。」
「input validation 等上线前再加」「开发中期加最省事,上线前加漏洞最多。你大概率会忘。」
「这个 prototype 不会进生产」「统计显示 70% 的 prototype 最终进了生产。按生产标准写。」

这个机制的效果很直观:团队实测数据显示,使用 Agent Skills 后 PR 包含测试的比率从 23% 提升到 81%,一次 Commit 变更行数从平均 380 行降到 95 行。AI 不再是那个「你说什么就做什么」的应声虫,而是变成了一个有自己的工程判断、会在关键时刻拉你一把的搭档。

三个专家角色

除了 20 个全流程技能,Agent Skills 还提供了三个专家角色的 persona,可以在代码审查、测试设计、安全审计时切换不同的视角:

code-reviewer

以 Google Staff Engineer 的标准做五轴代码审查:正确性、可读性、可维护性、性能、安全性。核心评判标准:「Staff 工程师会批准这个 PR 吗?」

test-engineer

QA 专家视角,关注测试策略、覆盖率分析、Prove-It 模式。不只检查「有没有测试」,更检查「测试能不能真正证明代码是对的」。

security-auditor

安全工程师视角,做漏洞检测、威胁建模、OWASP Top 10 评估。处理用户输入、认证、数据存储时自动激活。

安装与使用

Claude Code(推荐)

Claude Code 有官方 marketplace 支持,体验最完整。安装只需两条命令:

/plugin marketplace add addyosmani/agent-skills
/plugin install agent-skills@addy-agent-skills

安装后可以直接用七条斜杠命令触发完整流程,比如:

/spec    # 先定义需求
/plan    # 再分解任务
/build   # 然后增量实现
/test    # 跑测试验证
/review  # 代码审查
/ship    # 部署上线

Cursor

把 SKILL.md 文件复制到项目的 .cursor/rules/ 目录即可。可以复制单个技能,也可以引用整个 skills/ 目录。

Gemini CLI

gemini skills install https://github.com/addyosmani/agent-skills.git --path skills

其他工具

工具集成方式
Windsurf技能内容加入 rules 配置
GitHub Copilotagents/ 定义作为角色,技能放入 .github/copilot-instructions.md
Kiro IDE技能放在 .kiro/skills/ 目录
OpenCode通过 AGENTS.md 和 skill 工具使用
任何支持 system prompt 的 Agent技能是纯 Markdown,直接作为指令文件使用

注意:Claude Code 的体验最完整(有 marketplace + slash commands + 自动触发),其他工具需要手动配置,便利性稍差。项目 83 天历史、73 个 Open Issues 说明还在快速迭代中,生产环境建议锁定特定版本 tag。

量化效果数据

以下数据来自社区实测报告,对照组为相同团队在未使用 Agent Skills 时的基线数据:

指标未使用 Agent Skills使用后变化
单元测试覆盖率18%67%+272%
PR 包含测试的比率23%81%+252%
一次 Commit 变更行数~380 行~95 行-75%
Review 轮次中位数4.2 轮1.8 轮-57%
提交信息规范性31%88%+184%

Commit 变更行数从 380 降到 95 这个数据尤其值得注意。这不是说 AI 写得更少了,而是它在按照增量开发的节奏工作——每次改一小块、测试通过、再改下一块。Review 轮次从 4.2 降到 1.8 也说明了同样的问题:代码质量提高了,审查的来回减少了。

竞品对比

维度Agent SkillsAwesome Claude Codeobra/superpowersAnthropic 官方 Skills
定位工程规范工作流资源清单Claude Code 技能包官方范例
Stars33K
技能数量20 + 3 角色 + 4 检查清单N/A~10若干范例
流程覆盖完整(Define→Ship)无流程部分单技能示范
反合理化每个技能都有
Verification 机制每个技能都有退出条件部分
多 Agent 兼容8 种工具Claude CodeClaude CodeClaude 专属
Skill 格式规范标准化 SKILL.md纯 MarkdownMarkdown官方 SKILL.md
设计哲学工程纪律 > 代码能力资源聚合增强能力教学示范

Agent Skills 的差异化很明确:它不教 AI 写更好的代码,而是让 AI 按照工程规范写代码。Awesome Claude Code 是个资源列表,没有工作流;superpowers 偏向增强 AI 的能力(比如更好的文件操作),但不涉及工程纪律;Anthropic 官方 Skills 是平台教学,和 Osmani 的生产实践定位不冲突。

和这些竞品比,Agent Skills 最独特的地方是两点:一是完整的生命周期覆盖(从 idea 到 production),二是反合理化机制。前者让你不用东拼西凑,后者解决了 AI 编码代理最大的软肋。

优缺点

优势

  • 零成本安装,两行命令搞定(Claude Code)
  • 覆盖从需求到上线的完整开发流程,不用东拼西凑
  • 反合理化机制从根本上改变 AI 的工程行为
  • 8 种 AI 编码工具兼容,不锁定特定平台
  • Google 工程实践的沉淀,不是理论而是实战经验
  • 量化效果数据扎实:测试覆盖 +272%,Review 轮次 -57%
  • MIT 开源,可自由修改和扩展
  • 社区活跃,83 天 162 commits,迭代节奏快

不足

  • 项目仅 83 天,版本还在快速迭代,API 可能变动
  • Claude Code 体验最好,其他工具需手动配置
  • 全量导入 26 个构件的学习曲线不低
  • 文档以英文为主,中文资源有限
  • 解决工程纪律问题,不提升 AI 的代码生成能力
  • 个人小项目或快速原型场景收益不大
  • 73 个 Open Issues,部分功能尚不完善

综合评分与结论

创新性
9.5
实用性
9.3
工程质量
8.8
易用性
9.0
社区热度
9.2
可扩展性
8.5
9.0
综合评分

一句话结论

如果你正在用 AI 编码代理做正经的项目(不是写一次性的脚本),Agent Skills 是目前最好的工程纪律工具。它解决的不是 AI 不会写代码的问题,而是 AI 写的代码能不能放心用的问题。安装成本几乎为零,收益立竿见影。

推荐的使用策略:个人开发者直接全量安装;团队环境建议从 /review/test 两个技能开始,建立共识后再逐步扩大。AI 编码工具的时代,工程规范不是束缚,而是让 AI 的能力真正可用的前提。

参考链接