系统整理大模型 / LLM 方向的「八股文」与高频面试题,覆盖从底层原理到工程落地的完整知识体系。
🔗 在线阅读 → meko1.github.io/llm-interview-guide
LLMGuide 是一份开源的大模型面试知识库,把大模型方向零散的知识点整理成体系化、问答式的文档,帮你在面试前快速建立全局认知、查漏补缺。
- 🎯 面试导向:每篇文章末尾都附「高频追问」,模拟面试官的连环追问。
- 🧩 体系完整:从 Transformer 原理到 RAG / Agent / 推理部署 / 工程落地,一站式覆盖。
- 🆓 完全免费 & 开源:内容持续更新,欢迎一起完善。
- 🌏 中文友好:面向中文读者,兼顾通用受众与后端工程师转型视角。
适合:准备大模型 / AI 算法、AI 应用开发、AIGC 工程等岗位面试的同学,以及想系统入门大模型的开发者。
点击直达在线文档对应章节。
- 大模型零基础入门 — 完全没接触 AI 也能开始
- 大模型是怎么工作的(直觉版)(零公式建立正确直觉)
- 能做什么·不能做什么(能力边界 / 幻觉 / 新手误区)
- 大模型发展简史(word2vec → Transformer → ChatGPT → R1)
- 大模型术语速查表
- 大模型必备数学基础
- 核心概念总览 — 一文建立全局认知
- Transformer 架构详解
- Attention 与变体(MHA / MQA / GQA / MLA / FlashAttention)
- 位置编码(RoPE / ALiBi / 长上下文扩展)
- 归一化与激活函数(RMSNorm / Pre-Norm / SwiGLU)
- Tokenizer 与分词(BPE / WordPiece / SentencePiece)
- 解码与采样策略(greedy / beam / temperature / top-p)
- MoE 混合专家模型
- 长上下文专题(位置外推 / 滑窗 / KV 压缩 / vs RAG)
- 预训练目标与数据
- 数据工程与合成数据(清洗 / MinHash 去重 / 配比 / 合成数据)
- 缩放定律与涌现能力
- 分布式训练与显存优化(DP / TP / PP / ZeRO)
- AI 训练集群与网络通信(NVLink / IB / RoCE / NCCL / 故障恢复)
- MoE 训练与专家并行(负载均衡 / AllToAll / DeepSeekMoE)
- 大模型训练全流程(从0到1)(数据→预训练→SFT→对齐→部署 端到端地图)
- 微调范式(SFT / PEFT)
- LoRA / QLoRA 详解
- RLHF / DPO 对齐
- 偏好优化方法全景(DPO / IPO / KTO / ORPO / SimPO)
- 模型融合与合并(任务向量 / SLERP / TIES / DARE)
- 微调训练工具链实战(LLaMA-Factory / 显存估算 / 踩坑清单)
- Prompt 工程(Few-shot / CoT / ReAct / 注入防护)
- RAG 基础与流程
- Embedding 与向量数据库(HNSW / IVF / 选型)
- Embedding 与 Reranker 训练(对比学习 / 难负例 / 双塔 vs 交叉编码器)
- RAG 进阶与优化
- RAG 生产化与系统设计(架构分层 / 增量更新 / 缓存 / 高可用)
- RAG vs 长上下文 vs 微调(选型决策)
- Agent 基础与框架
- Function Calling 与 MCP
- MCP 协议深入(架构 / 原语 / 传输 / 安全)
- A2A 协议与 Agent 互操作(Agent Card / Task / vs MCP)
- Agent 记忆系统
- 上下文工程(Context Engineering)
- AI 工作流 vs Agent
- 多 Agent 与进阶范式
- Agent 评估与可靠性工程(轨迹评估 / 失败模式 / 护栏 / 可观测)
- 推理优化与部署(KV Cache / 量化 / vLLM / 投机解码)
- 推理性能压测与指标(TTFT / TPOT / 吞吐 / goodput)
- 量化实战深入(GPTQ / AWQ / SmoothQuant / KV 量化)
- AI 编译器与图优化(算子融合 / IR / torch.compile / TVM)
- GPU 与硬件基础(显存估算 / 算力 / 通信 / 选型)
- 国产算力与国产化适配(昇腾 / CANN / MindIE / 迁移)
- LangChain 与应用框架
- LLM 应用开发实战(流式 / Function Calling / 服务化 / 成本控制)
- AI 编程与 Coding Agent(补全 / SWE-bench / 代码 RAG)
- 编程 Agent 底层架构与机制(Claude Code / Codex:agentic loop / agentic search / 权限)
- 结构化输出详解(JSON Mode / 约束解码)
- AI 系统设计专题(高并发 / 私有化 / RAG 系统)
- LLMOps 生产运营(监控 / 成本治理 / 数据飞轮)
- AI 项目实战案例(企业 RAG / 代码助手 / Text2SQL / 多 Agent)
- 模型评估与幻觉
- 评测基准深入(MMLU / GPQA / Arena / Pass@k / 数据污染)
- 多模态大模型(CLIP / ViT / LLaVA)
- 多模态架构深挖 VLM(视觉编码器 / 连接器 / 原生多模态)
- 扩散模型与图像生成(Diffusion / Stable Diffusion / DiT)
- 视频生成(Sora / 时空 patch / 世界模型)
- 语音大模型(ASR / TTS / 实时语音对话)
- 经典模型盘点
- LLaMA 与 Qwen 架构演进(标准配方 / GQA / 大词表 / QK-Norm)
- DeepSeek 专题(MLA / DeepSeekMoE / GRPO / R1)
- 小语言模型与端侧(SLM)(Phi / Qwen-small / 端侧部署)
- 中文大模型生态全景(国产厂商 / 垂直模型 / 中文数据集与评测)
- 功能总览(终端原生 Agent / 工具 / Plan Mode / 子 Agent)
- 代码架构(分层架构 / QueryEngine / 工具层 / 通信层)
- 核心机制与扩展(agentic loop / 上下文压缩 / 权限模型 / MCP·Hooks·Skills)
- 工具系统详解(Read·Edit·Bash·Grep / TodoWrite vs Task)
- 扩展机制(Hooks/MCP/Skills)(确定性约束 vs 能力扩展)
- 子 Agent 与多 Agent 编排(上下文隔离 / 协调者蜂群 / Worktree)
- 最佳实践与高效用法(CLAUDE.md / 成本控制 / 避坑)
- 推理模型与慢思考(o1 / R1 / test-time compute)
- 强化学习基础(面向 LLM)(MDP / 策略梯度 / PPO / GRPO)
- Agentic RL(智能体强化学习)(多步任务 / 可验证奖励)
- 状态空间模型与 Mamba(SSM / 选择性扫描 / 混合架构)
- 具身智能与 VLA(Vision-Language-Action / 机器人基础模型)
- FlashAttention 深入(IO 感知 / online softmax / v1-v3)
- 训练深入(优化器 / 混合精度 / loss spike)
- 向量检索与 ANN 算法(HNSW / IVF / PQ)
- 大模型安全与对齐(越狱 / Prompt 注入 / 红队 / 护栏)
- AI 安全合规与治理(数据合规 / 内容安全 / 监管备案)
- 高频面试题速记 — 全站考点浓缩速查卡
- 手撕代码题解集 — MHA / RoPE / LoRA / DPO 等 10 道高频手撕题可运行题解
- 分岗位面试真题(算法 / 应用 / 工程 / 场景 / 手撕)
- 大模型学习路线
- LLM Course 中文路线图(Maxime Labonne 经典路线图译本)
- 学习资源汇总
需要 Node.js 18+。
npm install # 安装依赖
npm run dev # 本地开发,默认 http://localhost:5173
npm run build # 构建静态站点,输出到 docs/.vitepress/dist
npm run preview # 预览构建产物本仓库已内置 GitHub Actions 工作流(.github/workflows/),推送到 main 分支会自动构建并部署。
- 仓库 Settings → Pages,把 Source 设为 GitHub Actions。
- 推送到
main,Actions 自动构建发布。 - 站点地址:
https://<用户名>.github.io/llm-interview-guide/。
docs/.vitepress/config.mts的base已设为/llm-interview-guide/,与仓库名一致。若改了仓库名或用自定义域名/根路径部署,请相应修改base。
非常欢迎任何形式的贡献!
- 🐛 发现错误 / 表述不清 → 提 Issue
- ✍️ 补充内容 / 新增主题 / 修正错别字 → 提 Pull Request
- 📚 推荐优质学习资源 → 直接 PR 到 学习资源汇总
贡献前请阅读 贡献指南 CONTRIBUTING.md,了解写作规范与本地开发流程。
如果这个项目对你有帮助,欢迎点一个 ⭐ Star 支持一下,这是对维护者最大的鼓励!
本项目内容仅用于学习与交流,由社区整理,可能存在疏漏或随技术发展而过时之处,请结合权威资料与官方文档辩证参考。
MIT © Meko1