~/reviews · ai-engineering-from-scratch · 2026-05-27

cat README.md

ai-engineering-from-scratch

435 节课 · 20 个阶段 · 320 小时 · 从线性代数到自主智能体集群,每节课产出一个可复用制品——prompt、skill、agent、或 MCP server。MIT 开源,完全免费。

AI Education ML/DL LLM Agent MCP Multi-Language Open Source

// 目录

01 概览 02 我为什么关注这个项目 03 核心设计 04 课程全景 05 安装与使用 06 学习闭环架构 07 竞品对比 08 社区数据 09 博主观点

// 概览

STARS
20,700
今日新增 +2,155,总 Star 数突破 2 万
FORKS
3,500
活跃 Fork 率 16.9%,社区参与度高
COMMITS
1,345
Open Issues 8 个,维护响应及时
LICENSE
MIT
完全免费开源,商用无限制
LANGUAGES
4
Python · TypeScript · Rust · Julia
SCALE
435
节课 / 20 阶段 / 378 Skills / 99 Prompts

// 我为什么关注这个项目

说实话,我一开始看到这个项目名字"AI Engineering from Scratch"的时候,内心是有点抗拒的。市面上叫"从零开始"的教程我见过不下二十个,大部分是那种开头教你装个 Anaconda,然后甩给你一段 import torch 的代码就说"恭喜你已经入门了"的东西。

但这次不一样。我在 Trending 页面看到它 +2,155 Star 的数据,点进去之后在 README 里看到了一句话:

"Most AI material teaches in scattered pieces. A paper here, a fine-tuning post there, a flashy agent demo somewhere else. The pieces rarely line up."

这句话精准地戳到了我的痛点。我自己做 AI 行业研究这段时间,知识来源确实碎片化得厉害——今天看一篇 Transformer 的论文,明天刷到一段 LoRA 微调的教程,后天又看到一个 Multi-Agent 的 demo。信息是有了,但脑子里拼不出完整版图。

于是我认真翻了翻这个课程的目录。435 节课,20 个阶段,从线性代数开始,一路走到自主智能体集群。这体量本身就吓人。更关键的是,每节课都遵循同一个六步循环:Motto → Problem → Concept → Build It(纯数学手搓)→ Use It(用框架实现同样的东西)→ Ship It(产出可复用制品)。这种设计不是"教你调用 API",而是逼你先理解底层原理。

另外这个课程有个特别的地方——它不只是教知识,还要求你产出制品。每节课结束你不是拿到一张证书,而是得到一个 prompt、一个 skill 文件、一个 agent、或者一个 MCP server。这些东西可以直接扔到 Claude Code / Cursor / Codex 里用。这个"学完即用"的设计,在 AI 教育领域我之前没见过。

// 核心设计

让我用我自己的话把这个项目的核心设计拆开说。

六步学习循环

这个课程最大的设计亮点,我认为是它的六步循环。大多数教程的结构是"概念 → 代码",这个课程加了四步:

Motto(一行核心理念)→ Problem(具体痛点,让你知道"为什么要学这个")→ Concept(图解 + 直觉解释)→ Build It(从原始数学开始手搓,不允许直接用 PyTorch)→ Use It(用 PyTorch/sklearn 做同样的事,对比理解)→ Ship It(产出可复用制品)。

这六步的精妙之处在于,"Build It" 和 "Use It" 形成了对比。你先从零手写一个反向传播,然后再看 PyTorch 的 autograd 怎么做同样的事。这时候你不是在"背 API",你是在理解"哦原来这个函数底层做了这个"。这种先苦后甜的学习路径,虽然前期慢,但后期省的时间很可观。

四种可复用制品

每节课产出的东西不是作业答案,而是四种可复用制品:

Prompt 可直接粘贴到任何 AI 助手里获取专家级帮助。比如你学完 RAG 之后,得到的不是一个笔记,而是一个可以直接扔给 ChatGPT 的 RAG 设计 prompt,帮你用最佳实践搭建系统。

Skill 可以放到 Claude / Cursor / Codex / OpenClaw / Hermes 等支持 SKILL.md 的 Agent 里,让 AI 自动调用这些知识。课程总共产出了 378 个 skills。

Agent 在 Phase 14 你自己写完 Agent 循环之后,后面的课程产出的 Agent 可以直接作为自主工作者部署。

MCP Server 在 Phase 13 你从零构建 MCP 全栈之后,产出的 Server 可以接入任何 MCP 兼容客户端。

内置 Agent 技能

这个课程本身也自带两个 Agent 技能,可以直接装进你的 AI 编程助手:

/find-your-level — 十题定位测验,把你的知识水平映射到课程的某个阶段,然后生成个性化的学习路径和预估时长。相当于自动给你排课表。

/check-understanding — 每个阶段八题测验,带反馈和具体的课程推荐。答错了不会只告诉你错了,还会告诉你"回到 Phase 3 的第 7 节再看一遍"。

这两个功能看似简单,但解决了自学最大的痛点:不知道从哪里开始,也不知道自己哪里没搞懂。

// 课程全景

20 个阶段的课程编排,我按照自己的理解做了分层:

层级 阶段 内容 课时
地基 Phase 0 Setup & Tooling:开发环境、Git、GPU、Docker、调试 12
地基 Phase 1 Math Foundations:线性代数、微积分、概率论、优化、信息论、傅里叶变换 22
核心 Phase 2-3 ML 基础(回归/决策树/SVM/集成)+ DL 核心(感知机/反向传播/优化器) 31
核心 Phase 4-6 计算机视觉(CNN/YOLO/GAN/NeRF/ViT)+ NLP(嵌入/注意力/RAG)+ 语音(Whisper/TTS/语音克隆) 74
深度 Phase 7-10 Transformer 深入 + 生成式 AI(VAE/扩散/LoRA)+ RL(PPO/RLHF)+ LLM 从零搭建(分词/预训练/SFT/量化/DeepSeek-V3) 62
深度 Phase 11-12 LLM 工程(Prompt/RAG/LoRA/LangGraph)+ 多模态(CLIP/LLaVA/Transfusion/视频/VLA) 42
前沿 Phase 13-16 工具协议(MCP/A2A/OpenTelemetry)+ Agent 工程(记忆/规划/基准测试)+ 自主系统(长时域/安全/Kill Switch)+ 多智能体(MARL/群体优化) 112
前沿 Phase 17-19 生产部署(vLLM/SGLang/量化/FinOps)+ 安全对齐(红队/越狱/水印)+ Capstone 毕业项目(17 个) 75

几个让我眼睛一亮的设计点:

Phase 10 把 DeepSeek-V3 拆解了。你没看错,这个课程直接从零构建 DeepSeek-V3 的核心组件——Multi-Head Attention、MoE、KV Cache、GQA。市面上敢这么做的课程我没见过第二个。

Phase 12 覆盖了 Transfusion(Meta 的多模态统一架构)和 VLA(Vision-Language-Action,具身智能方向)。这说明课程在跟踪最前沿的研究,不是炒冷饭。

Phase 14 的 Agent 阶段有 42 节课,是所有阶段中最多的。这说明作者认为 Agent 是当前 AI 工程的核心战场,投入了大量篇幅。

Phase 19 的 17 个毕业项目,每一个都是 20-40 小时的完整工程。比如"Terminal-Native Coding Agent"(终端原生编程 Agent)、"Multi-Agent Software Engineering Team"(多 Agent 软件工程团队)、"MCP Server with Registry"(带注册中心的 MCP 服务器)。这些不是 toy project,是可以放进 portfolio 的实战项目。

// 安装与使用

三种方式用这个课程:

方式一:直接在线看

打开 aiengineeringfromscratch.com,零配置。网站有进度追踪功能,浏览器本地保存你的学习进度。

方式二:克隆到本地

# 克隆仓库 git clone https://github.com/rohitg00/ai-engineering-from-scratch.git cd ai-engineering-from-scratch # 直接运行任何课程的代码 python phases/01-math-foundations/01-linear-algebra-intuition/code/vectors.py

方式三:装进你的 AI Agent(推荐)

# 安装全部技能 npx skills add rohitg00/ai-engineering-from-scratch # 只装单个阶段的技能 npx skills add rohitg00/ai-engineering-from-scratch --phase 14 # 按标签安装(比如只要 RAG 相关) python3 scripts/install_skills.py <target> --tag rag # 在 Agent 里运行定位测验 /find-your-level

装完之后,你的 Claude Code / Cursor / Codex 就内置了一个完整的 AI 工程知识库。你写代码的时候,Agent 可以根据课程里的知识帮你做决策。这个"边学边用"的设计我给满分。


// 学习闭环架构

📖
Motto + Problem痛点驱动,明确"为什么"
🧮
Concept + Build数学手搓,禁止框架
🔧
Use It + Ship框架实现 + 产出制品
🚀
Agent Skill装入 AI Agent 即时可用
四步闭环:从"不知道"到"理解原理"再到"工具可用"到"AI 自动调用"

// 竞品对比

我把市面上主流的 AI 学习资源和这个课程做了对比。这不是简单的"哪个更好",而是"适合什么人"。

维度 AI Engineering From Scratch deeplearning.ai (Andrew Ng) Fast.ai (Jeremy Howard) hello-agents (Datawhale)
定位 AI 工程全栈参考手册 AI/ML 基础短课体系 实践驱动的 DL 课程 智能体系统性学习教程
体量 435 节 · 320 小时 多门短课,每门几小时 7 节课 + 实战项目 16 章 + 10 补充章
教学法 先数学手搓,再框架实现 理论讲解 + 代码练习 自顶向下,先上手再深入 从第一性原理出发
语言覆盖 Python/TS/Rust/Julia Python Python Python
Agent 深度 112 节(Phase 13-16) 部分课程涉及 未覆盖 核心重点,ReAct 到 MARL
产出 378 Skills + 99 Prompts 证书 项目代码 知识体系
费用 完全免费 部分免费,订阅 $49/月 完全免费 完全免费
视频 无(纯文字+代码)
适合人群 想系统理解 AI 底层的工程师 需要证书的转行者 视觉/传统 ML 学习者 想从用户转型 Agent 构建者

// 社区数据

课程阶段代码量分布(按各阶段课程数量):

Phase 14 Agent
42 节
Phase 4 CV
28 节
Phase 5 NLP
29 节
Phase 17 Production
28 节
Phase 12 Multimodal
25 节
Phase 18 Ethics
30 节
Phase 16 Multi-Agent
25 节
Phase 10 LLM
22 节
Phase 1 Math
22 节

// 博主观点

综合评分
8.8
/ 10 — 这是目前开源领域最系统性的 AI 工程学习资源
优点
✓ 六步学习循环设计精妙,"先数学后框架"真正帮你理解底层
✓ 435 节课从线性代数到多智能体集群,覆盖面无死角
✓ 378 个 Skills + 99 个 Prompts,学完即可用的产出不是口号
✓ 四种语言(Python/TS/Rust/Julia)按概念特点选择,不是炫技
✓ /find-your-level 智能定位 + /check-understanding 自测,解决自学盲区
✓ MIT 开源完全免费,无付费墙无注册
✓ Phase 10 直接拆解 DeepSeek-V3,敢这么做的课程独一份
✓ 17 个 20-40h 毕业项目,不是 toy project
短板
✗ 无视频内容,纯文字+代码,对视觉/听觉学习者不友好
✗ 无证书体系,不能用于简历 credential
✗ 单作者维护(Rohit Ghumare),Bus Factor ≈ 1,长期维护存疑
✗ 320 小时学习量太大,大多数人的意志力撑不到 Phase 14
✗ 378 个 Skills 的质量无法逐一保证
✗ 无社区互动(无 Discord/论坛),遇到问题只能看 Issue

说几句掏心窝的话。

我自己做 AI Coding 行业研究快半年了,一直在各种教程和论文之间跳来跳去。这个课程解决的核心问题是——拼图。AI 领域的知识碎片太严重了,你需要一个系统性的骨架把它们串起来。这个 20 阶段的课程就是那个骨架。

但我也得说句实话:320 小时的学习量,对大多数人来说是劝退级别的。我自己大概率也只会重点看 Phase 10-14(LLM 到 Agent 那段),因为那是我当前最需要的部分。好在课程的模块化设计允许你按需跳读,/find-your-level 帮你定位到合适的位置。

最后说一点:这个课程的"每节课产出可复用制品"这个设计,我认为代表了 AI 教育的一个新方向。传统的学习产出是"我理解了一个概念",这个课程的产出是"我多了一个可以给我的 AI Agent 用的工具"。知识从被动的理解变成了主动的生产力。这个范式转变,值得留意。


// links

📧 GitHub: rohitg00/ai-engineering-from-scratch

🌐 官网: aiengineeringfromscratch.com

📓 路线图: ROADMAP.md

📋 更新日志: CHANGELOG.md

📄 课程目录: catalog.json