~/reviews · momus-skill · 2026-06-04

cat README.md | head -50

momus-skill

一个会"怼你"的 AI 编程助手 Prompt 审查器。名字取自希腊神话中的讽刺之神 Momus——你的 coding 需求写得太烂?先过它这关再说。

Prompt Quality Gate AI Coding Agent Codex Cursor Claude Code Early Stage

// 目录

项目概览 为什么会有这个项目 工作机制详解 领域标准体系 安装与使用 架构流程 竞品对比 质量维度评估 博主观点

// 概览

Stars
0
项目尚处早期阶段,未被社区发现
Forks / Issues / PRs
0 / 0 / 0
完全单人开发,无外部协作记录
Commits / License
3 / N/A
3 次提交,仍未添加开源许可证
语言
Markdown
纯配置驱动项目,SKILL.md + 领域标准文件
核心文件
18
1 个 SKILL.md + 10 个领域标准 + 3 个配置文件
Contributor
Bus Factor = 1
badboy0080 单人维护,无协作者

// 一个让我「膝盖中箭」的项目

说真的,跑 GitHub AI 日报这么久,每天都在看各种「帮你写代码更快」的工具。但今天点开 momus-skill 的时候,我有那么几秒是沉默的——这玩意儿不是帮你写代码的,它是帮你审视你写代码时提的那些烂需求的

项目 README 第一句就写着:「一个会怼你的 skill。当你随便跟 AI 写你的需求的时候,请小心了!

我回想了一下自己跟 Claude Code 的日常对话——「帮我优化一下这个」「修复那个 bug」「做一个好看的前端页面」——好吧,如果 Momus 在场,我可能已经被怼到怀疑人生了。

这个项目的名字也不是随意的。Momus(摩摩斯)是希腊神话里的讽刺与批评之神,专门挑出神和人类的缺点。用这个命名一个 prompt 审查器,属实有点精准——你在给 AI 提需求的时候,写得太烂?Momus 会像挑剔的神一样告诉你哪里不行。

// 它是怎么「怼」你的

Momus 的逻辑不复杂,但设计得很系统。当一个 coding agent(Codex、Cursor、Claude Code 之类的)收到你的指令时,Momus 会先做一件事:拦住它,审一审这个 prompt 能不能执行。

触发时机

两种触发方式:

隐式触发——你说了「帮我修 bug」「优化一下」「做个前端页面」这种笼统到不行的词,Momus 自动跳出来说「你认真的?」

显式触发——你主动喊 $momus-skill,要求审查 prompt。

我也看了它的不触发清单——普通问题澄清、明确的文件修改、闲聊都不拦截。这个设计还挺聪明的,不会因为审查机制把正常对话搞得支离破碎。

7 维度审查引擎

Momus 从 7 个维度给 prompt 打分,这是它的核心判断框架:

维度审查什么烂的典型
目标是否明确说了想要什么结果「帮我搞一下」
上下文是否有项目状态、报错信息、业务背景直接甩一段代码零解释
完整性AI 原本需要猜测的关键细节是否都给了「做个 dashboard」
结构请求组织有序、能清晰提取任务与约束大段文字无分段无重点
有效性仅凭输入,一个合格 Agent 能否正确完成需求自相矛盾
范围是否明确了检查/修改/创建/避免什么「把所有代码优化一下」
验收标准怎样算完成,能否验证「做到好就行」

这 7 个维度坦白讲没什么革命性的——任何一个有经验的工程师在分配任务时都会下意识做这个检查。但把它系统化成一套 skill,让 coding agent 在执行前自动跑一遍,这个想法我是买单的。

审查后的输出

Momus 不会冷冰冰地抛给你一个「缺陷列表」——它会用硅基生物吐槽碳基生物的语气,带着 playfully sarcastic 的调子指出你的 prompt 问题,然后给出改写后的可执行版本。

来看看一个真实例子——原始 prompt:

// 用户输入(这就能让 AI 干活?) 帮我修复这个 bug

经过 Momus 审查和改写后:

// Momus 改写后的可执行 prompt 请你作为资深软件工程师,先阅读当前仓库并定位 bug 相关代码。 上下文: - 用户报告项目存在 bug,但尚未提供错误信息。 - 如果仓库中有测试、日志或 issue 线索,优先使用本地上下文。 目标: - 找到 bug 根因并实现最小修复。 范围: - 只修改与 bug 直接相关的文件。 - 不做无关重构或样式整理。 验证: - 添加或运行能复现问题的测试。 - 修复后运行相关测试并报告结果。 输出: - 简要说明根因、修改内容和验证结果。

最后它会抛一个嘲讽式确认问题——比如「就这水平还想让 AI 给你修 bug?要不要试试用这个版本?」——用户回「可以」就继续执行。

// 8 大领域标准:不只是 coding

我看了它的 references/prompt-standards/ 目录,Momus 不是只有一个通用的 prompt 模板。它把常见任务分成了 8 个领域,每个领域有自己专属的提示词标准。这个设计比想象中要用心:

编号领域典型任务
01工程工作流规划、架构评审、TDD、子代理、分支收尾
02软件开发编码、后端、API、全栈、调试、QA、部署
03前端设计网站/页面/组件/UI、落地页、响应式 QA
04产品/业务产品策略、范围界定、创业思维、决策框架
05数据分析指标、仪表盘、报告、KPI 解读
06内容/文档文档编写、Word/Docs 类工件
07Office 文档Excel/PPT 表格与演示文稿
09超能力工程Superpowers 插件集成的高级工程流程

第 08 号是一个扩展指南,用于新增领域。09 号优先于 01 号加载——因为它是基于 Superpowers 插件的增强版本。多领域任务最多加载 2 个文件:1 个主领域 + 1 个交付物领域。

我特别喜欢的一个细节:跨 IDE 适配。项目提供了针对 Cursor 和 Claude Code 的专用配置片段,因为 Momus 默认是为 Codex 设计的。Cursor 的配置里甚至说了「sarcasm 程度偏重,尖锐有对抗性」——这项目是真的在认真做「怼人」功能。

// 安装与使用

安装路径是标准的 Codex skills 目录结构:

# Windows C:\Users\<you>\.codex\skills\momus-skill\ # 把仓库 clone 进去就行 git clone https://github.com/badboy0080/momus-skill \ C:\Users\huyoc\.codex\skills\momus-skill\

Codex 会自动通过 SKILL.md 发现这个 skill。Cursor 和 Claude Code 则需要手动添加适配规则到各自的配置文件中。

不过有个槽点:README 里连最基本的 git clone 命令都没写,只说了「放进对应目录」。对于非 Codex 用户,你可能需要去翻 references/ide-adapter-snippets.md 才知道怎么配。这个门槛对早期项目来说不太友好。


// 架构流程

📝
用户输入Raw Prompt
🔍
7 维度审计目标·上下文·结构·范围
📂
领域匹配8 大标准按需加载
💬
讽刺评审 + 重写BLOCKED / OPTIMIZED_PASS
用户确认→执行或跳过 Momus 直接干活
Momus 的核心闭环:输入 → 审查 → 匹配领域 → 评审重写 → 确认执行

// 竞品对比

Momus 做的事情其实没有任何一个直接竞品——目前市面上没有第二个专门针对 AI Coding Agent 做 prompt 质量门控的 skill 工具。但如果在「prompt 质量保障」这条线上拉宽来看:

方案类型特点与 Momus 的差距
momus-skill IDE Skill 8 领域标准、sarcastic 交互、跨 IDE 适配、自动触发 – (基准)
手写 Cursor Rules 手动配置 灵活但零结构,往往写成「请仔细分析任务」这种废话 无领域标准、无审查维度、无自动重写、无 sarcasm 趣味性
Claude System Prompt 系统指令 Claude 原生能力,可注入「先确认目标再执行」等规则 每次要手写、无结构化审查框架、无跨 Agent 复用、无领域分类
aider 的 /ask 模式 CLI 工具 先提问再执行,但依赖人类自己回答 无自动审查、无 prompt 重写、无领域适配
OpenAI Prompt Caching 基础设施 节省 token 但不能帮你写需求 完全不相关领域,只优化成本不优化质量

说实话,Momus 最大的优势恰恰是它最大的限制:这个品类太小众了。愿意在 coding agent 里再加一个 skill 来审查 prompt 的人,通常是已经对 AI 编程有相当深度认知的用户。对大众用户来说,「帮我修 bug」就够了,他们不会在乎 Momus 说不说这句话太模糊。


// 质量维度评估

Momus 没有量化 benchmark 数据,但它自己的 7 维度框架可以用来反向评估它自身:

设计理念创新
85%
领域标准覆盖面
78%
审查规则严谨度
72%
跨 IDE 适配程度
55%
社区成熟度
5%
实际验证度
2%

* 评估基于项目设计完整性、文档质量与已知社区数据的综合分析,非严格量化指标


// 博主观点

VERDICT · 综合评分
6.8/10
设计理念优秀,工程成熟度极早期
// PROS
+ 概念精准:Prompt Quality Gate 这个定位在 AI Coding 生态里确实是空白
+ 结构完整:7 维度审查 + 8 领域标准 + 跨 IDE 适配,不是拍脑袋的 toy project
+ 交互有趣:sarcasm 风格让 prompt 审查这件事不枯燥,有记忆点
+ 规则详尽:SKILL.md 写了 400+ 行的触发规则、审查逻辑和输出格式,比大多数开源 skill 要严谨
+ 扩展性好:通过 references/ 目录 + 索引导航,新增领域标准零耦合
// CONS
- 社区为零:0 Star / 0 Fork / 0 Issue / 0 PR,未经过任何真实场景验证
- Bus Factor = 1:单人维护,无协作者,一旦作者断更项目直接死亡
- 无许可证:没有 LICENSE 文件,开源社区不敢 fork 和使用
- 文档入门成本高:README 只有概念描述,缺少快速上手教程和 GIF 演示
- 实际效果未知:没有任何用户反馈、案例或 A/B 测试数据证明 Momus 真的能减少返工
- 使用门槛悖论:能理解 Momus 价值的深度用户不需要它;需要它的新手用户可能不理解它的价值

说实话,给这个项目打分我纠结了很久。从想法的角度,我真的很喜欢——每天对着 AI 说「帮我修 bug」的开发者太多了,如果有东西能逼他们多想一步,coding agent 的体验会好一大截。但 0 Star 和 3 commits 的现实也确实没法忽视。

我建议作者做几件事把这个项目盘活:

1. 加 LICENSE——Apache-2.0 或 MIT,这是开源社区的第一道门槛
2. 做 GIF 演示——拍一段在 Codex 里说「帮我优化项目」然后被 Momus 制裁的录屏,比一千字都有说服力
3. 去 Reddit/Twitter 发帖——r/cursor、r/ClaudeCode、「终于有人做了 prompt 审查器」这个叙事很适合传播
4. 打包成 npm/skill marketplace——降低安装门槛,不要指望用户手动 clone
5. 收集案例——搞一个「Momus 拯救了我的 prompt」合集,把优化前后对比列出来

这个项目不是代码量很大的那种,但设计思想是对的。就看作者有没有意愿把它从一个聪明的 idea变成一个可用的工具


// links

GitHub 仓库
SKILL.md 完整定义
8 大领域标准文件
跨 IDE 适配片段