cat README.md
ai-engineering-from-scratch
435 节课 · 20 个阶段 · 320 小时 · 从线性代数到自主智能体集群,每节课产出一个可复用制品——prompt、skill、agent、或 MCP server。MIT 开源,完全免费。
// 目录
// 概览
// 我为什么关注这个项目
说实话,我一开始看到这个项目名字"AI Engineering from Scratch"的时候,内心是有点抗拒的。市面上叫"从零开始"的教程我见过不下二十个,大部分是那种开头教你装个 Anaconda,然后甩给你一段 import torch 的代码就说"恭喜你已经入门了"的东西。
但这次不一样。我在 Trending 页面看到它 +2,155 Star 的数据,点进去之后在 README 里看到了一句话:
"Most AI material teaches in scattered pieces. A paper here, a fine-tuning post there, a flashy agent demo somewhere else. The pieces rarely line up."
这句话精准地戳到了我的痛点。我自己做 AI 行业研究这段时间,知识来源确实碎片化得厉害——今天看一篇 Transformer 的论文,明天刷到一段 LoRA 微调的教程,后天又看到一个 Multi-Agent 的 demo。信息是有了,但脑子里拼不出完整版图。
于是我认真翻了翻这个课程的目录。435 节课,20 个阶段,从线性代数开始,一路走到自主智能体集群。这体量本身就吓人。更关键的是,每节课都遵循同一个六步循环:Motto → Problem → Concept → Build It(纯数学手搓)→ Use It(用框架实现同样的东西)→ Ship It(产出可复用制品)。这种设计不是"教你调用 API",而是逼你先理解底层原理。
另外这个课程有个特别的地方——它不只是教知识,还要求你产出制品。每节课结束你不是拿到一张证书,而是得到一个 prompt、一个 skill 文件、一个 agent、或者一个 MCP server。这些东西可以直接扔到 Claude Code / Cursor / Codex 里用。这个"学完即用"的设计,在 AI 教育领域我之前没见过。
// 核心设计
让我用我自己的话把这个项目的核心设计拆开说。
六步学习循环
这个课程最大的设计亮点,我认为是它的六步循环。大多数教程的结构是"概念 → 代码",这个课程加了四步:
Motto(一行核心理念)→ Problem(具体痛点,让你知道"为什么要学这个")→ Concept(图解 + 直觉解释)→ Build It(从原始数学开始手搓,不允许直接用 PyTorch)→ Use It(用 PyTorch/sklearn 做同样的事,对比理解)→ Ship It(产出可复用制品)。
这六步的精妙之处在于,"Build It" 和 "Use It" 形成了对比。你先从零手写一个反向传播,然后再看 PyTorch 的 autograd 怎么做同样的事。这时候你不是在"背 API",你是在理解"哦原来这个函数底层做了这个"。这种先苦后甜的学习路径,虽然前期慢,但后期省的时间很可观。
四种可复用制品
每节课产出的东西不是作业答案,而是四种可复用制品:
Prompt 可直接粘贴到任何 AI 助手里获取专家级帮助。比如你学完 RAG 之后,得到的不是一个笔记,而是一个可以直接扔给 ChatGPT 的 RAG 设计 prompt,帮你用最佳实践搭建系统。
Skill 可以放到 Claude / Cursor / Codex / OpenClaw / Hermes 等支持 SKILL.md 的 Agent 里,让 AI 自动调用这些知识。课程总共产出了 378 个 skills。
Agent 在 Phase 14 你自己写完 Agent 循环之后,后面的课程产出的 Agent 可以直接作为自主工作者部署。
MCP Server 在 Phase 13 你从零构建 MCP 全栈之后,产出的 Server 可以接入任何 MCP 兼容客户端。
内置 Agent 技能
这个课程本身也自带两个 Agent 技能,可以直接装进你的 AI 编程助手:
/find-your-level — 十题定位测验,把你的知识水平映射到课程的某个阶段,然后生成个性化的学习路径和预估时长。相当于自动给你排课表。
/check-understanding — 每个阶段八题测验,带反馈和具体的课程推荐。答错了不会只告诉你错了,还会告诉你"回到 Phase 3 的第 7 节再看一遍"。
这两个功能看似简单,但解决了自学最大的痛点:不知道从哪里开始,也不知道自己哪里没搞懂。
// 课程全景
20 个阶段的课程编排,我按照自己的理解做了分层:
| 层级 | 阶段 | 内容 | 课时 |
|---|---|---|---|
| 地基 | Phase 0 | Setup & Tooling:开发环境、Git、GPU、Docker、调试 | 12 |
| 地基 | Phase 1 | Math Foundations:线性代数、微积分、概率论、优化、信息论、傅里叶变换 | 22 |
| 核心 | Phase 2-3 | ML 基础(回归/决策树/SVM/集成)+ DL 核心(感知机/反向传播/优化器) | 31 |
| 核心 | Phase 4-6 | 计算机视觉(CNN/YOLO/GAN/NeRF/ViT)+ NLP(嵌入/注意力/RAG)+ 语音(Whisper/TTS/语音克隆) | 74 |
| 深度 | Phase 7-10 | Transformer 深入 + 生成式 AI(VAE/扩散/LoRA)+ RL(PPO/RLHF)+ LLM 从零搭建(分词/预训练/SFT/量化/DeepSeek-V3) | 62 |
| 深度 | Phase 11-12 | LLM 工程(Prompt/RAG/LoRA/LangGraph)+ 多模态(CLIP/LLaVA/Transfusion/视频/VLA) | 42 |
| 前沿 | Phase 13-16 | 工具协议(MCP/A2A/OpenTelemetry)+ Agent 工程(记忆/规划/基准测试)+ 自主系统(长时域/安全/Kill Switch)+ 多智能体(MARL/群体优化) | 112 |
| 前沿 | Phase 17-19 | 生产部署(vLLM/SGLang/量化/FinOps)+ 安全对齐(红队/越狱/水印)+ Capstone 毕业项目(17 个) | 75 |
几个让我眼睛一亮的设计点:
Phase 10 把 DeepSeek-V3 拆解了。你没看错,这个课程直接从零构建 DeepSeek-V3 的核心组件——Multi-Head Attention、MoE、KV Cache、GQA。市面上敢这么做的课程我没见过第二个。
Phase 12 覆盖了 Transfusion(Meta 的多模态统一架构)和 VLA(Vision-Language-Action,具身智能方向)。这说明课程在跟踪最前沿的研究,不是炒冷饭。
Phase 14 的 Agent 阶段有 42 节课,是所有阶段中最多的。这说明作者认为 Agent 是当前 AI 工程的核心战场,投入了大量篇幅。
Phase 19 的 17 个毕业项目,每一个都是 20-40 小时的完整工程。比如"Terminal-Native Coding Agent"(终端原生编程 Agent)、"Multi-Agent Software Engineering Team"(多 Agent 软件工程团队)、"MCP Server with Registry"(带注册中心的 MCP 服务器)。这些不是 toy project,是可以放进 portfolio 的实战项目。
// 安装与使用
三种方式用这个课程:
方式一:直接在线看
打开 aiengineeringfromscratch.com,零配置。网站有进度追踪功能,浏览器本地保存你的学习进度。
方式二:克隆到本地
方式三:装进你的 AI Agent(推荐)
装完之后,你的 Claude Code / Cursor / Codex 就内置了一个完整的 AI 工程知识库。你写代码的时候,Agent 可以根据课程里的知识帮你做决策。这个"边学边用"的设计我给满分。
// 学习闭环架构
// 竞品对比
我把市面上主流的 AI 学习资源和这个课程做了对比。这不是简单的"哪个更好",而是"适合什么人"。
| 维度 | AI Engineering From Scratch | deeplearning.ai (Andrew Ng) | Fast.ai (Jeremy Howard) | hello-agents (Datawhale) |
|---|---|---|---|---|
| 定位 | AI 工程全栈参考手册 | AI/ML 基础短课体系 | 实践驱动的 DL 课程 | 智能体系统性学习教程 |
| 体量 | 435 节 · 320 小时 | 多门短课,每门几小时 | 7 节课 + 实战项目 | 16 章 + 10 补充章 |
| 教学法 | 先数学手搓,再框架实现 | 理论讲解 + 代码练习 | 自顶向下,先上手再深入 | 从第一性原理出发 |
| 语言覆盖 | Python/TS/Rust/Julia | Python | Python | Python |
| Agent 深度 | 112 节(Phase 13-16) | 部分课程涉及 | 未覆盖 | 核心重点,ReAct 到 MARL |
| 产出 | 378 Skills + 99 Prompts | 证书 | 项目代码 | 知识体系 |
| 费用 | 完全免费 | 部分免费,订阅 $49/月 | 完全免费 | 完全免费 |
| 视频 | 无(纯文字+代码) | 有 | 有 | 无 |
| 适合人群 | 想系统理解 AI 底层的工程师 | 需要证书的转行者 | 视觉/传统 ML 学习者 | 想从用户转型 Agent 构建者 |
// 社区数据
课程阶段代码量分布(按各阶段课程数量):
// 博主观点
✓ 六步学习循环设计精妙,"先数学后框架"真正帮你理解底层
✓ 435 节课从线性代数到多智能体集群,覆盖面无死角
✓ 378 个 Skills + 99 个 Prompts,学完即可用的产出不是口号
✓ 四种语言(Python/TS/Rust/Julia)按概念特点选择,不是炫技
✓ /find-your-level 智能定位 + /check-understanding 自测,解决自学盲区
✓ MIT 开源完全免费,无付费墙无注册
✓ Phase 10 直接拆解 DeepSeek-V3,敢这么做的课程独一份
✓ 17 个 20-40h 毕业项目,不是 toy project
✗ 无视频内容,纯文字+代码,对视觉/听觉学习者不友好
✗ 无证书体系,不能用于简历 credential
✗ 单作者维护(Rohit Ghumare),Bus Factor ≈ 1,长期维护存疑
✗ 320 小时学习量太大,大多数人的意志力撑不到 Phase 14
✗ 378 个 Skills 的质量无法逐一保证
✗ 无社区互动(无 Discord/论坛),遇到问题只能看 Issue
说几句掏心窝的话。
我自己做 AI Coding 行业研究快半年了,一直在各种教程和论文之间跳来跳去。这个课程解决的核心问题是——拼图。AI 领域的知识碎片太严重了,你需要一个系统性的骨架把它们串起来。这个 20 阶段的课程就是那个骨架。
但我也得说句实话:320 小时的学习量,对大多数人来说是劝退级别的。我自己大概率也只会重点看 Phase 10-14(LLM 到 Agent 那段),因为那是我当前最需要的部分。好在课程的模块化设计允许你按需跳读,/find-your-level 帮你定位到合适的位置。
最后说一点:这个课程的"每节课产出可复用制品"这个设计,我认为代表了 AI 教育的一个新方向。传统的学习产出是"我理解了一个概念",这个课程的产出是"我多了一个可以给我的 AI Agent 用的工具"。知识从被动的理解变成了主动的生产力。这个范式转变,值得留意。
// links
📧 GitHub: rohitg00/ai-engineering-from-scratch
🌐 官网: aiengineeringfromscratch.com
📓 路线图: ROADMAP.md
📋 更新日志: CHANGELOG.md
📄 课程目录: catalog.json