~/reviews · momus-skill · 2026-06-04

cat README.md | head -50

momus-skill

一个会"怼你"的 AI 编程助手 Prompt 审查器。名字取自希腊神话中的讽刺之神 Momus——你的 coding 需求写得太烂？先过它这关再说。

Prompt Quality Gate AI Coding Agent Codex Cursor Claude Code Early Stage

// 目录

项目概览为什么会有这个项目工作机制详解领域标准体系安装与使用架构流程竞品对比质量维度评估博主观点

// 概览

Stars

项目尚处早期阶段，未被社区发现

Forks / Issues / PRs

0 / 0 / 0

完全单人开发，无外部协作记录

Commits / License

3 / N/A

3 次提交，仍未添加开源许可证

语言

Markdown

纯配置驱动项目，SKILL.md + 领域标准文件

核心文件

1 个 SKILL.md + 10 个领域标准 + 3 个配置文件

Contributor

Bus Factor = 1

badboy0080 单人维护，无协作者

// 一个让我「膝盖中箭」的项目

说真的，跑 GitHub AI 日报这么久，每天都在看各种「帮你写代码更快」的工具。但今天点开 momus-skill 的时候，我有那么几秒是沉默的——这玩意儿不是帮你写代码的，它是帮你审视你写代码时提的那些烂需求的。

项目 README 第一句就写着：「一个会怼你的 skill。当你随便跟 AI 写你的需求的时候，请小心了！」

我回想了一下自己跟 Claude Code 的日常对话——「帮我优化一下这个」「修复那个 bug」「做一个好看的前端页面」——好吧，如果 Momus 在场，我可能已经被怼到怀疑人生了。

这个项目的名字也不是随意的。Momus（摩摩斯）是希腊神话里的讽刺与批评之神，专门挑出神和人类的缺点。用这个命名一个 prompt 审查器，属实有点精准——你在给 AI 提需求的时候，写得太烂？Momus 会像挑剔的神一样告诉你哪里不行。

// 它是怎么「怼」你的

Momus 的逻辑不复杂，但设计得很系统。当一个 coding agent（Codex、Cursor、Claude Code 之类的）收到你的指令时，Momus 会先做一件事：拦住它，审一审这个 prompt 能不能执行。

触发时机

两种触发方式：

隐式触发——你说了「帮我修 bug」「优化一下」「做个前端页面」这种笼统到不行的词，Momus 自动跳出来说「你认真的？」

显式触发——你主动喊 $momus-skill，要求审查 prompt。

我也看了它的不触发清单——普通问题澄清、明确的文件修改、闲聊都不拦截。这个设计还挺聪明的，不会因为审查机制把正常对话搞得支离破碎。

7 维度审查引擎

Momus 从 7 个维度给 prompt 打分，这是它的核心判断框架：

维度	审查什么	烂的典型
目标	是否明确说了想要什么结果	「帮我搞一下」
上下文	是否有项目状态、报错信息、业务背景	直接甩一段代码零解释
完整性	AI 原本需要猜测的关键细节是否都给了	「做个 dashboard」
结构	请求组织有序、能清晰提取任务与约束	大段文字无分段无重点
有效性	仅凭输入，一个合格 Agent 能否正确完成	需求自相矛盾
范围	是否明确了检查/修改/创建/避免什么	「把所有代码优化一下」
验收标准	怎样算完成，能否验证	「做到好就行」

这 7 个维度坦白讲没什么革命性的——任何一个有经验的工程师在分配任务时都会下意识做这个检查。但把它系统化成一套 skill，让 coding agent 在执行前自动跑一遍，这个想法我是买单的。

审查后的输出

Momus 不会冷冰冰地抛给你一个「缺陷列表」——它会用硅基生物吐槽碳基生物的语气，带着 playfully sarcastic 的调子指出你的 prompt 问题，然后给出改写后的可执行版本。

来看看一个真实例子——原始 prompt：

// 用户输入（这就能让 AI 干活？）帮我修复这个 bug

经过 Momus 审查和改写后：

// Momus 改写后的可执行 prompt 请你作为资深软件工程师，先阅读当前仓库并定位 bug 相关代码。上下文： - 用户报告项目存在 bug，但尚未提供错误信息。 - 如果仓库中有测试、日志或 issue 线索，优先使用本地上下文。目标： - 找到 bug 根因并实现最小修复。范围： - 只修改与 bug 直接相关的文件。 - 不做无关重构或样式整理。验证： - 添加或运行能复现问题的测试。 - 修复后运行相关测试并报告结果。输出： - 简要说明根因、修改内容和验证结果。

最后它会抛一个嘲讽式确认问题——比如「就这水平还想让 AI 给你修 bug？要不要试试用这个版本？」——用户回「可以」就继续执行。

// 8 大领域标准：不只是 coding

我看了它的 references/prompt-standards/ 目录，Momus 不是只有一个通用的 prompt 模板。它把常见任务分成了 8 个领域，每个领域有自己专属的提示词标准。这个设计比想象中要用心：

编号	领域	典型任务
01	工程工作流	规划、架构评审、TDD、子代理、分支收尾
02	软件开发	编码、后端、API、全栈、调试、QA、部署
03	前端设计	网站/页面/组件/UI、落地页、响应式 QA
04	产品/业务	产品策略、范围界定、创业思维、决策框架
05	数据分析	指标、仪表盘、报告、KPI 解读
06	内容/文档	文档编写、Word/Docs 类工件
07	Office 文档	Excel/PPT 表格与演示文稿
09	超能力工程	Superpowers 插件集成的高级工程流程

第 08 号是一个扩展指南，用于新增领域。09 号优先于 01 号加载——因为它是基于 Superpowers 插件的增强版本。多领域任务最多加载 2 个文件：1 个主领域 + 1 个交付物领域。

我特别喜欢的一个细节：跨 IDE 适配。项目提供了针对 Cursor 和 Claude Code 的专用配置片段，因为 Momus 默认是为 Codex 设计的。Cursor 的配置里甚至说了「sarcasm 程度偏重，尖锐有对抗性」——这项目是真的在认真做「怼人」功能。

// 安装与使用

安装路径是标准的 Codex skills 目录结构：

# Windows C:\Users\<you>\.codex\skills\momus-skill\ # 把仓库 clone 进去就行 git clone https://github.com/badboy0080/momus-skill \ C:\Users\huyoc\.codex\skills\momus-skill\

Codex 会自动通过 SKILL.md 发现这个 skill。Cursor 和 Claude Code 则需要手动添加适配规则到各自的配置文件中。

不过有个槽点：README 里连最基本的 git clone 命令都没写，只说了「放进对应目录」。对于非 Codex 用户，你可能需要去翻 references/ide-adapter-snippets.md 才知道怎么配。这个门槛对早期项目来说不太友好。

// 架构流程

📝

用户输入Raw Prompt

→

🔍

7 维度审计目标·上下文·结构·范围

→

📂

领域匹配8 大标准按需加载

→

💬

讽刺评审 + 重写BLOCKED / OPTIMIZED_PASS

→

✅

用户确认→执行或跳过 Momus 直接干活

Momus 的核心闭环：输入 → 审查 → 匹配领域 → 评审重写 → 确认执行

// 竞品对比

Momus 做的事情其实没有任何一个直接竞品——目前市面上没有第二个专门针对 AI Coding Agent 做 prompt 质量门控的 skill 工具。但如果在「prompt 质量保障」这条线上拉宽来看：

方案	类型	特点	与 Momus 的差距
momus-skill	IDE Skill	8 领域标准、sarcastic 交互、跨 IDE 适配、自动触发	– (基准)
手写 Cursor Rules	手动配置	灵活但零结构，往往写成「请仔细分析任务」这种废话	无领域标准、无审查维度、无自动重写、无 sarcasm 趣味性
Claude System Prompt	系统指令	Claude 原生能力，可注入「先确认目标再执行」等规则	每次要手写、无结构化审查框架、无跨 Agent 复用、无领域分类
aider 的 /ask 模式	CLI 工具	先提问再执行，但依赖人类自己回答	无自动审查、无 prompt 重写、无领域适配
OpenAI Prompt Caching	基础设施	节省 token 但不能帮你写需求	完全不相关领域，只优化成本不优化质量

说实话，Momus 最大的优势恰恰是它最大的限制：这个品类太小众了。愿意在 coding agent 里再加一个 skill 来审查 prompt 的人，通常是已经对 AI 编程有相当深度认知的用户。对大众用户来说，「帮我修 bug」就够了，他们不会在乎 Momus 说不说这句话太模糊。

// 质量维度评估

Momus 没有量化 benchmark 数据，但它自己的 7 维度框架可以用来反向评估它自身：

设计理念创新

85%

领域标准覆盖面

78%

审查规则严谨度

72%

跨 IDE 适配程度

55%

社区成熟度

实际验证度

* 评估基于项目设计完整性、文档质量与已知社区数据的综合分析，非严格量化指标

// 博主观点

VERDICT · 综合评分

6.8/10

设计理念优秀，工程成熟度极早期

// PROS
+ 概念精准：Prompt Quality Gate 这个定位在 AI Coding 生态里确实是空白
+ 结构完整：7 维度审查 + 8 领域标准 + 跨 IDE 适配，不是拍脑袋的 toy project
+ 交互有趣：sarcasm 风格让 prompt 审查这件事不枯燥，有记忆点
+ 规则详尽：SKILL.md 写了 400+ 行的触发规则、审查逻辑和输出格式，比大多数开源 skill 要严谨
+ 扩展性好：通过 references/ 目录 + 索引导航，新增领域标准零耦合

// CONS
- 社区为零：0 Star / 0 Fork / 0 Issue / 0 PR，未经过任何真实场景验证
- Bus Factor = 1：单人维护，无协作者，一旦作者断更项目直接死亡
- 无许可证：没有 LICENSE 文件，开源社区不敢 fork 和使用
- 文档入门成本高：README 只有概念描述，缺少快速上手教程和 GIF 演示
- 实际效果未知：没有任何用户反馈、案例或 A/B 测试数据证明 Momus 真的能减少返工
- 使用门槛悖论：能理解 Momus 价值的深度用户不需要它；需要它的新手用户可能不理解它的价值

说实话，给这个项目打分我纠结了很久。从想法的角度，我真的很喜欢——每天对着 AI 说「帮我修 bug」的开发者太多了，如果有东西能逼他们多想一步，coding agent 的体验会好一大截。但 0 Star 和 3 commits 的现实也确实没法忽视。

我建议作者做几件事把这个项目盘活：

1. 加 LICENSE——Apache-2.0 或 MIT，这是开源社区的第一道门槛
2. 做 GIF 演示——拍一段在 Codex 里说「帮我优化项目」然后被 Momus 制裁的录屏，比一千字都有说服力
3. 去 Reddit/Twitter 发帖——r/cursor、r/ClaudeCode、「终于有人做了 prompt 审查器」这个叙事很适合传播
4. 打包成 npm/skill marketplace——降低安装门槛，不要指望用户手动 clone
5. 收集案例——搞一个「Momus 拯救了我的 prompt」合集，把优化前后对比列出来

这个项目不是代码量很大的那种，但设计思想是对的。就看作者有没有意愿把它从一个聪明的 idea变成一个可用的工具。

// links

GitHub 仓库
 SKILL.md 完整定义
 8 大领域标准文件
 跨 IDE 适配片段