~/reviews · ai-engineering-from-scratch · 2026-05-27

cat README.md

ai-engineering-from-scratch

435 节课 · 20 个阶段 · 320 小时 · 从线性代数到自主智能体集群，每节课产出一个可复用制品——prompt、skill、agent、或 MCP server。MIT 开源，完全免费。

AI Education ML/DL LLM Agent MCP Multi-Language Open Source

// 目录

01 概览 02 我为什么关注这个项目 03 核心设计 04 课程全景 05 安装与使用 06 学习闭环架构 07 竞品对比 08 社区数据 09 博主观点

// 概览

STARS

20,700

今日新增 +2,155，总 Star 数突破 2 万

FORKS

3,500

活跃 Fork 率 16.9%，社区参与度高

COMMITS

1,345

Open Issues 8 个，维护响应及时

LICENSE

MIT

完全免费开源，商用无限制

LANGUAGES

Python · TypeScript · Rust · Julia

SCALE

435

节课 / 20 阶段 / 378 Skills / 99 Prompts

// 我为什么关注这个项目

说实话，我一开始看到这个项目名字"AI Engineering from Scratch"的时候，内心是有点抗拒的。市面上叫"从零开始"的教程我见过不下二十个，大部分是那种开头教你装个 Anaconda，然后甩给你一段 import torch 的代码就说"恭喜你已经入门了"的东西。

但这次不一样。我在 Trending 页面看到它 +2,155 Star 的数据，点进去之后在 README 里看到了一句话：

"Most AI material teaches in scattered pieces. A paper here, a fine-tuning post there, a flashy agent demo somewhere else. The pieces rarely line up."

这句话精准地戳到了我的痛点。我自己做 AI 行业研究这段时间，知识来源确实碎片化得厉害——今天看一篇 Transformer 的论文，明天刷到一段 LoRA 微调的教程，后天又看到一个 Multi-Agent 的 demo。信息是有了，但脑子里拼不出完整版图。

于是我认真翻了翻这个课程的目录。435 节课，20 个阶段，从线性代数开始，一路走到自主智能体集群。这体量本身就吓人。更关键的是，每节课都遵循同一个六步循环：Motto → Problem → Concept → Build It（纯数学手搓）→ Use It（用框架实现同样的东西）→ Ship It（产出可复用制品）。这种设计不是"教你调用 API"，而是逼你先理解底层原理。

另外这个课程有个特别的地方——它不只是教知识，还要求你产出制品。每节课结束你不是拿到一张证书，而是得到一个 prompt、一个 skill 文件、一个 agent、或者一个 MCP server。这些东西可以直接扔到 Claude Code / Cursor / Codex 里用。这个"学完即用"的设计，在 AI 教育领域我之前没见过。

// 核心设计

让我用我自己的话把这个项目的核心设计拆开说。

六步学习循环

这个课程最大的设计亮点，我认为是它的六步循环。大多数教程的结构是"概念 → 代码"，这个课程加了四步：

Motto（一行核心理念）→ Problem（具体痛点，让你知道"为什么要学这个"）→ Concept（图解 + 直觉解释）→ Build It（从原始数学开始手搓，不允许直接用 PyTorch）→ Use It（用 PyTorch/sklearn 做同样的事，对比理解）→ Ship It（产出可复用制品）。

这六步的精妙之处在于，"Build It" 和 "Use It" 形成了对比。你先从零手写一个反向传播，然后再看 PyTorch 的 autograd 怎么做同样的事。这时候你不是在"背 API"，你是在理解"哦原来这个函数底层做了这个"。这种先苦后甜的学习路径，虽然前期慢，但后期省的时间很可观。

四种可复用制品

每节课产出的东西不是作业答案，而是四种可复用制品：

Prompt 可直接粘贴到任何 AI 助手里获取专家级帮助。比如你学完 RAG 之后，得到的不是一个笔记，而是一个可以直接扔给 ChatGPT 的 RAG 设计 prompt，帮你用最佳实践搭建系统。

Skill 可以放到 Claude / Cursor / Codex / OpenClaw / Hermes 等支持 SKILL.md 的 Agent 里，让 AI 自动调用这些知识。课程总共产出了 378 个 skills。

Agent 在 Phase 14 你自己写完 Agent 循环之后，后面的课程产出的 Agent 可以直接作为自主工作者部署。

MCP Server 在 Phase 13 你从零构建 MCP 全栈之后，产出的 Server 可以接入任何 MCP 兼容客户端。

内置 Agent 技能

这个课程本身也自带两个 Agent 技能，可以直接装进你的 AI 编程助手：

/find-your-level — 十题定位测验，把你的知识水平映射到课程的某个阶段，然后生成个性化的学习路径和预估时长。相当于自动给你排课表。

/check-understanding — 每个阶段八题测验，带反馈和具体的课程推荐。答错了不会只告诉你错了，还会告诉你"回到 Phase 3 的第 7 节再看一遍"。

这两个功能看似简单，但解决了自学最大的痛点：不知道从哪里开始，也不知道自己哪里没搞懂。

// 课程全景

20 个阶段的课程编排，我按照自己的理解做了分层：

层级	阶段	内容	课时
地基	Phase 0	Setup & Tooling：开发环境、Git、GPU、Docker、调试	12
地基	Phase 1	Math Foundations：线性代数、微积分、概率论、优化、信息论、傅里叶变换	22
核心	Phase 2-3	ML 基础（回归/决策树/SVM/集成）+ DL 核心（感知机/反向传播/优化器）	31
核心	Phase 4-6	计算机视觉（CNN/YOLO/GAN/NeRF/ViT）+ NLP（嵌入/注意力/RAG）+ 语音（Whisper/TTS/语音克隆）	74
深度	Phase 7-10	Transformer 深入 + 生成式 AI（VAE/扩散/LoRA）+ RL（PPO/RLHF）+ LLM 从零搭建（分词/预训练/SFT/量化/DeepSeek-V3）	62
深度	Phase 11-12	LLM 工程（Prompt/RAG/LoRA/LangGraph）+ 多模态（CLIP/LLaVA/Transfusion/视频/VLA）	42
前沿	Phase 13-16	工具协议（MCP/A2A/OpenTelemetry）+ Agent 工程（记忆/规划/基准测试）+ 自主系统（长时域/安全/Kill Switch）+ 多智能体（MARL/群体优化）	112
前沿	Phase 17-19	生产部署（vLLM/SGLang/量化/FinOps）+ 安全对齐（红队/越狱/水印）+ Capstone 毕业项目（17 个）	75

几个让我眼睛一亮的设计点：

Phase 10 把 DeepSeek-V3 拆解了。你没看错，这个课程直接从零构建 DeepSeek-V3 的核心组件——Multi-Head Attention、MoE、KV Cache、GQA。市面上敢这么做的课程我没见过第二个。

Phase 12 覆盖了 Transfusion（Meta 的多模态统一架构）和 VLA（Vision-Language-Action，具身智能方向）。这说明课程在跟踪最前沿的研究，不是炒冷饭。

Phase 14 的 Agent 阶段有 42 节课，是所有阶段中最多的。这说明作者认为 Agent 是当前 AI 工程的核心战场，投入了大量篇幅。

Phase 19 的 17 个毕业项目，每一个都是 20-40 小时的完整工程。比如"Terminal-Native Coding Agent"（终端原生编程 Agent）、"Multi-Agent Software Engineering Team"（多 Agent 软件工程团队）、"MCP Server with Registry"（带注册中心的 MCP 服务器）。这些不是 toy project，是可以放进 portfolio 的实战项目。

// 安装与使用

三种方式用这个课程：

方式一：直接在线看

打开 aiengineeringfromscratch.com，零配置。网站有进度追踪功能，浏览器本地保存你的学习进度。

方式二：克隆到本地

# 克隆仓库 git clone https://github.com/rohitg00/ai-engineering-from-scratch.git cd ai-engineering-from-scratch # 直接运行任何课程的代码 python phases/01-math-foundations/01-linear-algebra-intuition/code/vectors.py

方式三：装进你的 AI Agent（推荐）

# 安装全部技能 npx skills add rohitg00/ai-engineering-from-scratch # 只装单个阶段的技能 npx skills add rohitg00/ai-engineering-from-scratch --phase 14 # 按标签安装（比如只要 RAG 相关） python3 scripts/install_skills.py <target> --tag rag # 在 Agent 里运行定位测验 /find-your-level

装完之后，你的 Claude Code / Cursor / Codex 就内置了一个完整的 AI 工程知识库。你写代码的时候，Agent 可以根据课程里的知识帮你做决策。这个"边学边用"的设计我给满分。

// 学习闭环架构

📖

Motto + Problem痛点驱动，明确"为什么"

→

🧮

Concept + Build数学手搓，禁止框架

→

🔧

Use It + Ship框架实现 + 产出制品

→

🚀

Agent Skill装入 AI Agent 即时可用

四步闭环：从"不知道"到"理解原理"再到"工具可用"到"AI 自动调用"

// 竞品对比

我把市面上主流的 AI 学习资源和这个课程做了对比。这不是简单的"哪个更好"，而是"适合什么人"。

维度	AI Engineering From Scratch	deeplearning.ai (Andrew Ng)	Fast.ai (Jeremy Howard)	hello-agents (Datawhale)
定位	AI 工程全栈参考手册	AI/ML 基础短课体系	实践驱动的 DL 课程	智能体系统性学习教程
体量	435 节 · 320 小时	多门短课，每门几小时	7 节课 + 实战项目	16 章 + 10 补充章
教学法	先数学手搓，再框架实现	理论讲解 + 代码练习	自顶向下，先上手再深入	从第一性原理出发
语言覆盖	Python/TS/Rust/Julia	Python	Python	Python
Agent 深度	112 节（Phase 13-16）	部分课程涉及	未覆盖	核心重点，ReAct 到 MARL
产出	378 Skills + 99 Prompts	证书	项目代码	知识体系
费用	完全免费	部分免费，订阅 $49/月	完全免费	完全免费
视频	无（纯文字+代码）	有	有	无
适合人群	想系统理解 AI 底层的工程师	需要证书的转行者	视觉/传统 ML 学习者	想从用户转型 Agent 构建者

// 社区数据

课程阶段代码量分布（按各阶段课程数量）：

Phase 14 Agent

42 节

Phase 4 CV

28 节

Phase 5 NLP

29 节

Phase 17 Production

28 节

Phase 12 Multimodal

25 节

Phase 18 Ethics

30 节

Phase 16 Multi-Agent

25 节

Phase 10 LLM

22 节

Phase 1 Math

22 节

// 博主观点

综合评分

8.8

/ 10 — 这是目前开源领域最系统性的 AI 工程学习资源

优点
✓ 六步学习循环设计精妙，"先数学后框架"真正帮你理解底层
✓ 435 节课从线性代数到多智能体集群，覆盖面无死角
✓ 378 个 Skills + 99 个 Prompts，学完即可用的产出不是口号
✓ 四种语言（Python/TS/Rust/Julia）按概念特点选择，不是炫技
✓ /find-your-level 智能定位 + /check-understanding 自测，解决自学盲区
✓ MIT 开源完全免费，无付费墙无注册
✓ Phase 10 直接拆解 DeepSeek-V3，敢这么做的课程独一份
✓ 17 个 20-40h 毕业项目，不是 toy project

短板
✗ 无视频内容，纯文字+代码，对视觉/听觉学习者不友好
✗ 无证书体系，不能用于简历 credential
✗ 单作者维护（Rohit Ghumare），Bus Factor ≈ 1，长期维护存疑
✗ 320 小时学习量太大，大多数人的意志力撑不到 Phase 14
✗ 378 个 Skills 的质量无法逐一保证
✗ 无社区互动（无 Discord/论坛），遇到问题只能看 Issue

说几句掏心窝的话。

我自己做 AI Coding 行业研究快半年了，一直在各种教程和论文之间跳来跳去。这个课程解决的核心问题是——拼图。AI 领域的知识碎片太严重了，你需要一个系统性的骨架把它们串起来。这个 20 阶段的课程就是那个骨架。

但我也得说句实话：320 小时的学习量，对大多数人来说是劝退级别的。我自己大概率也只会重点看 Phase 10-14（LLM 到 Agent 那段），因为那是我当前最需要的部分。好在课程的模块化设计允许你按需跳读，/find-your-level 帮你定位到合适的位置。

最后说一点：这个课程的"每节课产出可复用制品"这个设计，我认为代表了 AI 教育的一个新方向。传统的学习产出是"我理解了一个概念"，这个课程的产出是"我多了一个可以给我的 AI Agent 用的工具"。知识从被动的理解变成了主动的生产力。这个范式转变，值得留意。

// links

📧 GitHub: rohitg00/ai-engineering-from-scratch

🌐 官网: aiengineeringfromscratch.com

📓 路线图: ROADMAP.md

📋 更新日志: CHANGELOG.md

📄 课程目录: catalog.json