~/reviews · Kilo-Org/kilocode · 2026-06-19

cat README.md

Kilo Code

我想用 Claude Opus 做规划、DeepSeek V4 写代码、GPT-5.5 查 bug——但每个 AI 编码工具都把我锁在它选的模型里。Cursor 8 个选,Copilot 15 个选,Claude Code 只让用 Claude。更要命的是,全闭源,我连它什么时候偷偷换了模型都不知道。上周 Kilo Code 涨了 1,345 Star 上了 Trending,进去一看——500+ 模型、零加价、Apache-2.0 开源、VS Code 和 JetBrains 都能跑。模型自由这件事,终于有人把它做成了完整方案。

coding-agent 500+ models Apache-2.0 BYOK multi-platform orchestrator Memory Bank MCP marketplace zero markup TypeScript

// 目录

01. 换模型等于换工具,这事我一直觉得不对 02. AI 编程助手该不该绑模型?我的判断 03. Kilo Code 到底做了什么不一样的事 04. 拆开看的几个关键判断 05. 跟我在做的事有什么关系 06. 横向对比 07. 性能数据 08. 长期关注点和评分

// 概览

Stars (total)
22,143
今日 +1,345 Star,GitHub Trending AI 类涨幅最高未评测项目
Forks / Issues / PRs
2.7K / 675 / 126
23,612 commits,433 releases(v7.3.46 最新,2026-06-15)
Language / License
TS 83.5% + Kotlin 12%
Apache-2.0 完全开源可商用,3M+下载量,OpenRouter 调用量排名第一

换模型等于换工具,这事我一直觉得不对

我最近在做项目的时候反复踩一个坑:想用不同模型处理不同任务。规划功能架构时,我需要 Claude Opus 那种能梳理思路的长周期模型;写代码时,DeepSeek V4 Flash 够快够便宜;调试时,GPT-5.5 的综合推理能力确实更强。但现实是——每个工具都把我锁在它选的模型池里。

Cursor 给你 8 个模型选,订阅 20 美金/月起,用了超出配额进"慢池"。GitHub Copilot 给你 15 个模型,10 美金/月起,但自动补全还是以 OpenAI 为主。Claude Code 更干脆——只用 Claude,17 美金/月起,终端优先,没有 IDE 行内补全。Windsurf 用积分制,定价规则根本看不懂。

最让我不舒服的不是选择少,是看不见。这些工具全是闭源的,我不知道它们什么时候静默换了模型、截断了上下文窗口、或者把我的代码数据做了什么处理。我想搞明白到底发生了什么,得去翻别人的逆向分析帖。

这种情况我忍了两个月。上周看到 Kilo Code 上 Trending 涨了 1,345 星——500+ 模型、零加价、Apache-2.0 全开源、VS Code 和 JetBrains 都能跑。我愣了一下。

AI 编程助手该不该绑模型?我的判断

我的判断就一句话:AI 编程助手的下一个战场不是谁更强,是谁更不绑你。

模型正在快速分化——Claude Opus 4.8 的规划编排能力目前最强(SWE-bench Verified 87.6%),GPT-5.5 的综合推理最稳(88.7%),DeepSeek V4 Flash 的性价比最高($0.20/M token),Nemotron 3 Ultra 在 PinchBench 上 91% 且免费。不同任务用不同模型,这不是折腾,是效率。锁死一个模型池等于强迫用户穿一双鞋跑所有赛道。

闭源工具正在用"便利"换"控制"——Cursor 的体验确实流畅,但流畅的前提是你接受它替你选模型、替你定价格、替你决定上下文窗口大小。Claude Code 的编码准确率高,但高准确率的前提是你只用 Claude、只用终端、只用 Anthropic 的定价体系。便利和控制捆绑销售,用户以为自己选了"更好",实际是选了"更绑"。

开源透明正在从边缘走向主流——Kilo Code 的 Apache-2.0 协议不是嘴上说说,你能看到每个请求发了什么提示词、用了什么模型、上下文窗口多大。代码可以 fork 可以改可以自托管。这跟 Cursor/Copilot/Windsurf 那种"我帮你选模型你别管"的模式,根本不是同一个赛道。

Kilo Code 到底做了什么不一样的事

先说清楚它的出身:Kilo Code 是 Cline → Roo Code 的二次衍生分支,Cline 做了底层架构(VS Code 上的代理式编码),Roo Code 加了多模型和自定义模式,Kilo Code 再加了 Memory Bank、Orchestrator 并行调度、MCP 市场、Kilo Gateway 网关、JetBrains 支持、CLI 重构。可以理解为"站在两个前辈肩膀上,补齐了它们没做到的短板"。

我试了一周之后,觉得它做对了三件事。

模型自由不是噱头

500+ 模型不是堆数字——它有 Auto Model 自动路由,根据任务类型自动匹配旗舰/均衡/免费模型。我做规划时它自动推荐 Claude Opus,写代码时推荐 DeepSeek V4 Flash,调试时推荐 GPT-5.5。免费模型包括 Nemotron 3 Ultra(PinchBench 91%)、laguna-m.1、nex-n2-pro 等,真免费不是试用后收费。BYOK 不是部分支持——自动补全、代理、聊天全部支持自带 API 密钥。本地模型(Ollama/LM Studio)也能接,代码完全不出本地。

计费方式也跟别人不一样:零加价,按供应商原价。用 DeepSeek V4 Flash 就付 DeepSeek 的价,用 Claude Opus 就付 Anthropic 的价,中间不抽一分。Cursor 那种捆绑订阅+慢池降级+不透明 token 定价的玩法,在 Kilo Code 里不存在。

五种模式不是换皮

Code 模式(写代码)、Architect 模式(先规划再写)、Debug 模式(查 bug)、Ask 模式(纯问答不改代码)、Custom 模式(自己定义规则)。这不是把一个模型换个名字包装五种,是真的针对不同任务类型调了提示词、工具权限、输出格式。Architect 模式写代码前会先输出结构化设计文档让你确认,Debug 模式只读不改,Ask 模式连终端权限都不给——每个模式知道自己该干什么、不该干什么

更狠的是 Orchestrator 模式——可以并行调度多个代理同时工作。规划、编码、代码审查三件事同时跑,不用等着一个做完再起下一个。复杂项目里这个效率提升很明显。

多平台不是口号

VS Code、JetBrains 全家桶、CLI、云端代理、移动端、Slack——所有环境的会话状态、活跃代理、变量自动同步。我在 VS Code 里做的 Architect 规划,打开 JetBrains 继续编码时不用重新解释项目背景。这个跨设备状态同步是 Kilo Code 的独家优势,其他工具要么只支持一个 IDE(Cursor),要么只支持终端(Claude Code),要么同步靠手动(Cline)。

拆开看的几个关键判断

做完一周我回过头看,有几个判断想说:

Memory Bank——这是解决"每次新会话重新解释项目"问题的关键功能,把架构决策、编码模式、项目上下文持久化存储。团队可以把资深开发者的领域知识沉淀进去,新人上手速度明显加快。但说实话,目前 Memory Bank 的质量取决于你喂了什么,它不会自己提炼——你得主动写好项目文档让它记住。

MCP 市场——内置 Model Context Protocol 服务器市场,一键安装扩展让代理对接数据库、API、文档系统。跟随 MCP 生态发展,未来插件越来越多时 Kilo Code 自动获得新能力。但现阶段可用插件还不算丰富,跟 VS Code Marketplace 的规模比差一个数量级。

定价模型——零平台费 + 按供应商原价计费,对轻度用户来说可能月成本 5-10 美金就够了,比 Cursor 的 20 美金/月省。但对重度用户来说,高频使用 Claude Opus/GPT-5.5 等前沿模型,月成本可能超过订阅模式。Kilo Pass 订阅套餐(19-199 美金/月)可以抵扣推理费用,有连续订阅奖励。不是所有人的最优解,但对想精确控制成本的人来说比捆绑订阅更灵活。

KiloClaw——一键部署类 OpenClaw 的 24 小时运行代理,支持 Telegram/Discord/Slack 对接,可跑定时任务和自动化脚本。55 美金/月,不用自己搞 SSH/Docker/yaml。功能本身不错,但跟 Kilo Code 的核心价值(模型自由)不是同一个卖点。

PR Code Review——配置后自动对 PR 做代码审查,识别性能、安全、风格、覆盖率问题。适合团队用,个人开发者用不太上。

跟我在做的事有什么关系

我每天跑 GitHub AI 日报自动化,这个流程本身就是 Agentic 工作负载:搜索→筛选→调研→写作→排版→同步。每个步骤最适合的模型不一样——搜索用便宜快的,调研用长上下文强的,写作用推理好的,排版用格式感强的。

现在我用的方案是分散的:搜索靠 GitHub API + 网页抓取,调研靠 Claude/GPT 轮着用,写作靠自定义 skill,排版靠专用模板。每个环节都得单独配置模型和工具。如果 Kilo Code 的 Orchestrator + Auto Model 真能按步骤自动路由模型,理论上可以把我现在分散在五个工具里的工作流统一到一个平台跑。

但说实话,我目前还没迁移。两个原因:日报写作的 skill 和 humanizer 流程是深度定制的,迁移成本不小;Kilo Code 的 CLI 体验还在优化期,不如 Claude Code 的终端体验打磨得那么成熟。我的判断是:等 CLI 体验再迭代两版、Orchestrator 模式支持自定义 skill 路径之后,我会认真考虑迁移

更重要的是,这件事的判断方向是对的:AI 编程助手的市场正在从"谁最强"变成"谁最不绑你"。我做日报的过程中一直在切工具切模型,这个问题不是个例——所有重度 AI 用户都会碰到。模型自由 + 开源透明 + 多平台同步,这个组合以前没人做完整,Kilo Code 是第一个。


// architecture

🧠
User自然语言任务描述
Kilo GatewayAuto Model 路由 + 500+ 模型选择
🔄
Orchestrator5 模式 + 并行调度
🛠
ActionCode / Plan / Debug / Ask / Custom
💾
Memory Bank项目上下文持久化
🔌
MCP Market一键扩展外部工具
📱
Multi-PlatformVS Code / JetBrains / CLI / Mobile
🔒
Open SourceApache-2.0 全透明可审计
Kilo Code 的架构核心是"Gateway 路由 → Orchestrator 分工 → Action 执行",外围由 Memory Bank、MCP 市场和多平台同步支撑

// comparison

项目 核心定位 模型数 开源 IDE支持 定价 优势 短板
Kilo Code 模型自由的代理式编码平台 500+ Apache-2.0 VS Code + JetBrains + CLI + Mobile 零平台费 + 按供应商原价 模型自由、开源透明、跨平台同步、Orchestrator 并行 675 Issues、CLI 待打磨、企业功能较新、新用户学习曲线陡
Cursor AI 原生编辑器 ~8 闭源 Cursor 定制 IDE $20-200/月订阅 IDE 原生体验最流畅,开箱即用 模型锁定、慢池降级、闭源不透明、token 定价不透明
Claude Code 终端编码代理 3 (Claude only) 闭源 终端 $17-200/月订阅 SWE-bench 编码准确率最高,终端体验打磨成熟 只支持 Claude、无 IDE 补全、闭源、模型锁定
GitHub Copilot 自动补全 + Agent ~15 闭源 VS Code + JetBrains $10-39/月订阅 最成熟的自动补全,微软生态深度集成 Agent 能力有限、模型选择少、闭源、仅微软 IDE
Cline / Roo Code VS Code 代理式编码 BYOK Apache-2.0 VS Code BYOK 自付 底层架构扎实、开源可审计 功能不如 Kilo Code 全面、无 Orchestrator/Memory Bank
Windsurf AI IDE + Cascade ~8 闭源 Windsurf 定制 IDE $15/月 + 积分制 Cascade 记忆连续性好 积分制定价不透明、闭源、模型锁定、每日限制

// benchmarks

模型数量
Kilo Code: 500+
Cursor: ~8
Copilot: ~15
Claude Code: 3
Kilo Bench 任务完成率 & 成本(真实用户数据)
GPT-5.5
74.2% · $72.63/任务
Opus 4.7
70.1% · $100.51
Kimi K2.7
60.7% · $32.94
Nemotron 3 Ultra
PinchBench 91% · 免费
// VERDICT — 博主综合评分
8.4
out of 10 — 方向对了,打磨还需时间
✅ 500+ 模型零加价,模型自由不是噱头而是设计
✅ Apache-2.0 全开源,提示词/模型/上下文全可审计
✅ VS Code + JetBrains + CLI + Mobile 多平台状态同步是独家优势
✅ Orchestrator 并行调度 + 5 模式分工,复杂项目效率提升明显
✅ BYOK 全功能支持 + 本地模型(Ollama/LM Studio)零成本可用
✅ 3M+ 下载量、OpenRouter 调用量第一、433 个 Release 高频迭代
❌ 675 Issues / 126 PRs 积压,社区响应速度跟不上迭代速度
❌ 新用户配置选项太多,学习曲线比 Cursor/Copilot 陡
❌ CLI 体验不如 Claude Code 打磨成熟,终端重度用户暂不推荐
❌ 企业功能(Teams/Enterprise)上线时间短,成熟度待验证
❌ 重度用户使用前沿模型时成本可能超过订阅模式,不可预测
❌ Cline → Roo Code → Kilo Code 的分支谱系容易让新用户困惑

// links

GitHub: Kilo-Org/kilocode — 主仓库,Apache-2.0 开源

kilo.ai — 官网,500+ 模型排行榜

kilo.ai/pricing — 定价页,零平台费 + 按供应商原价

kilo.ai/leaderboard — 模型排行榜,Kilo Bench 真实数据

kilo.ai/docs — 官方文档

VS Code Marketplace — VS Code 安装入口

ComputerTech Review 2026 — 第三方深度评测(4.3/5)