2026-05-13 每日深度评测

mattpocock/skills:把 20 年工程经验压缩进 AI 的斜杠命令

不是又一个 AI 编程提示词合集——而是用 AI 重新定义什么叫"做工程的纪律"。

+3,867
今日 Star
76,055
总 Star
6,600
Forks
MIT
开源协议
Claude Code AI Agent Skills TDD 工程纪律 需求对齐 Shell
8.6
综合评分 / 10

🔍 这东西到底是什么

简单说,mattpocock/skills 是一个 Claude Code 技能包,18 个斜杠命令,覆盖从需求对齐到架构维护的整个开发生命周期。安装只需要一行命令,30 秒搞定。

但它真正想解决的,是一个很多人不愿意承认的问题:用 AI 写代码,和用 AI 做工程,是两件完全不同的事。

前者叫 vibe coding——让 AI 生成代码,感觉对了就完事。后者是让 AI 遵循工程纪律,像有经验的老工程师一样工作。Matt Pocock 选了后者。

👤 Matt Pocock 是谁

如果你关注 TypeScript 社区,应该听过这个名字。他是 Total TypeScript 的作者,在类型体操这块基本是中文圈外最有影响力的教育者之一。现在运营 aihero.dev,一个 AI 教学站点。

60,000 订阅者的 newsletter,说明他在开发者社区的影响力不小。他有一个特点:擅长把复杂概念用极其简洁的方式讲清楚。这个特点也体现在他的 Skills 设计里——每个技能文件都短得离谱,但信息密度极高。

🎯 四个痛点,四组解法

Matt 把 AI 编程的常见失败模式归纳成了四类,每类配了对应的技能。这个分类方法本身就很值得学习。

痛点一:需求不对齐
你让 AI 做个退款功能,它给你写了个删订单的接口。来回折腾三轮,需求还是没对齐。
💡 解法:/grill-me / /grill-with-docs

这是整个仓库里最火的技能。原理极其简单——让 AI 反过来拷问你。在写一行代码之前,AI 会像面试官一样逐个追问:退款是全额还是部分?触发条件是什么?库存怎么处理?直到每个决策分支都被穷举干净。

《程序员修炼之道》:"没有人确切知道自己想要什么。"grill-me 就是把这句话变成了工程实践。

grill-with-docs 是加强版——一边追问,一边把共识写进 CONTEXT.md(共享术语表)和 ADR(架构决策记录)。用 Matt 自己的话说,"很难解释这有多强大,这可能是整个仓库里最酷的技巧。"

痛点二:输出太冗余
AI 用 20 个字解释一个概念,1 个字就够了。token 消耗飞快,沟通效率低下。
💡 解法:CONTEXT.md + /caveman

CONTEXT.md 是项目级的"共享语言词典"——

修改前
"课程中的某个章节被'实体化'(即在文件系统中获得一个位置)时出现问题"
修改后
"materialization cascade 有问题"

五个词替代了一整段话。AI 理解这个术语后,变量命名、函数命名、文件命名全都统一。caveman 模式更狠——直接砍掉 75% 的 token 消耗,只保留技术信息。

痛点三:代码跑不通
AI 写的代码编译不通过,或者运行时出 bug。让它修,改了 A 又坏了 B。
💡 解法:/tdd + /diagnose

tdd 技能强制执行红-绿-重构循环。核心原则是"禁止水平切片"——每次只做一个功能点。

RED 写测试 GREEN 最少实现 REFACTOR 重构 下一个循环

diagnose 是结构化调试流程,六阶段循环:构建反馈循环 → 复现 → 生成假设 → 逐步验证 → 修复并写回归测试 → 清理和总结。关键规则:一次只改一个变量

痛点四:架构崩坏
AI 越写越快,代码越来越乱。模块耦合严重,改一处动全身。
💡 解法:/to-prd + /zoom-out + /improve-codebase-architecture
Kent Beck:"每天都要投资于系统的设计。"但这恰恰是 AI 编程最容易忽视的。

to-prd 在动手之前先帮你理清要碰哪些模块,自动生成 PRD 并提交为 GitHub Issue。zoom-out 让 AI 站到更高的视角解释代码在系统中的位置。improve-codebase-architecture 识别"浅模块"和重构机会,建议每隔几天跑一次。

安装和使用

安装只需一行:

npx skills@latest add mattpocock/skills

安装后选择你需要的技能和目标 agent(Claude Code、Codex 等),然后运行 /setup-matt-pocock-skills 做一次性配置:

配置三步

1. 选择 Issue Tracker(GitHub / Linear / 本地文件)
2. 配置 Triage Labels
3. 指定文档保存路径

配置完成后会生成 CONTEXT.md,后续所有技能都会参考这个共享术语表。

📋 完整技能清单

工程技能(10个)

技能用途
/diagnose结构化调试,六阶段循环
/grill-with-docs带文档的深度需求访谈
/triageIssue 分诊状态机
/improve-codebase-architecture架构改进诊断
/setup-matt-pocock-skills初始化配置(首次使用必选)
/tddTDD 垂直切片开发
/to-issues将计划拆分为独立 Issue
/to-prd生成 PRD 并提交 Issue
/zoom-out代码全局视角解读
/prototype快速构建一次性原型

生产力技能(4个)

技能用途
/caveman极简通信模式,省 75% token
/grill-me需求深度访谈
/handoff压缩对话为交接文档
/write-a-skill创建自定义技能

杂项工具(4个)

技能用途
/git-guardrails-claude-codeGit 安全护栏
/migrate-to-shoehorn迁移测试断言
/scaffold-exercises练习目录脚手架
/setup-pre-commit配置 Husky + lint-staged

⚔️ 和同类项目对比

目前 AI 编程技能领域的三个主要项目,定位差异很明显:

维度mattpocock/skillsaddyosmani/agent-skillsAnthropic 官方
作者TypeScript 教育者Chrome 团队工程师Anthropic 官方
核心理念工程纪律 + 需求对齐Google 工程实践规范平台使用教学模板
技能数量18 个20 + 7 命令 + 3 角色基础模板
关键特色grill-me 需求拷问反合理化机制官方最佳实践
适用场景日常工程开发大型项目工程规范入门学习
目标用户1-5 年经验开发者团队工程负责人Claude Code 新手

三个项目可以叠加使用。addyosmani 的偏"大项目规范",mattpocock 的偏"日常工程纪律",Anthropic 官方的偏"入门教学"。不冲突。

如果你只想装一个

个人开发者选 mattpocock/skills,团队负责人选 addyosmani/agent-skills。

⚠️ 踩坑经验

grill-me 变成单向汇报

AI 有时会把"拷问你"变成"向你汇报方案"。如果连续 3 轮没有追问,手动说"继续追问"。

CONTEXT.md 膨胀

这个文件会随着使用不断增长。定期清理,通用术语保留,临时决策移到 docs/adr/。否则 token 消耗会失控。

TDD 水平切片陷阱

AI 天然喜欢"一次性搞定所有测试"。如果你发现 AI 一次写了 5 个测试还没写实现代码,直接打断,让它一个一个来。

技能没有被自动触发

检查 SKILL.md 的 description 字段是否包含触发词。Claude Code 的技能匹配依赖关键词。

💭 我的看法

这个项目最打动我的不是某个具体的 prompt 写得多漂亮,而是它把 AI 编程从"聊天框里的临时经验"推到了"可安装、可版本化、可复用的工程资产"

grill-me 的 prompt 只有 7 行 Markdown,但它解决的是 AI 编程里最根本的问题——你不是不知道自己要什么,你只是没被问到。这比任何花哨的提示词工程都有用。

当然,它也有局限。18 个技能里,有 4 个是杂项工具,日常用到的可能就 2-3 个。真正核心的是 grill-me/grill-with-docs、tdd、diagnose 这几个。另外,目前只支持 Claude Code 和 Codex,对其他 AI 编程工具的支持还在社区层面。

还有一点值得注意:这些技能的质量高度依赖 CONTEXT.md 的质量。如果你的项目没有建立共享术语表,grill-with-docs 和 caveman 的效果会大打折扣。所以 setup 步骤不能偷懒。

总体来说,这是目前 AI 编程工程化方向上最实用的开源项目之一。不是因为它有多复杂,恰恰相反——是因为它足够简洁,每个技能都解决一个真实问题,没有为了炫技而设计的部分。

📊 综合评分

实用性
9.5
创新性
8.2
文档质量
7.8
易用性
9.2
社区生态
6.5
可扩展性
8.0
综合
8.6