Skip to content

Modern GenAI 学习笔记

基于 modern_genai_bilibili commit c8b2cdd53462b9db23ee0fc8c0e7d7ab2698cb15


全书结构总览

章节主题
第一篇:数学与编程基础第 1-3 章概率统计、线性代数、微积分与采样
第二篇:大语言模型第 4-7 章Transformer、注意力、训练、多模态、可解释性
第三篇:深度强化学习与 LLM 对齐第 8-13 章RL 基础、PG→PPO、奖励模型、对齐、RLVR、蒸馏
第四篇:训练基础设施与工程第 14-16 章分布式训练、推理引擎、verl/TRL 框架
第五篇:现代 Agent第 17-20 章Prompt 工程、RAG、Agent 框架、高级 Agent
附录A-B开发工具链、杂项资源

第一篇:数学与编程基础

第二篇:大语言模型

第三篇:深度强化学习与 LLM 对齐

第四篇:训练基础设施与工程

第五篇:现代 Agent

附录


阅读建议

入门路径:第 1-3 章(数学基础)→ 第 4-5 章(Transformer)→ 第 8-9 章(RL 基础)→ 第 17 章(Prompt 工程)

LLM 对齐路径:第 8-9 章 → 第 10-11 章(奖励模型与对齐)→ 第 12 章(RLVR)→ 第 16 章(verl 实践)

Agent 开发路径:第 17 章(Prompt/API)→ 第 18 章(RAG)→ 第 19 章(Agent 框架)→ 第 20 章(高级话题)

工程部署路径:第 14 章(分布式训练)→ 第 15 章(推理引擎)→ 第 16 章(verl/TRL)→ 附录 A(工具链)