🎓

AI PhD 毕业考核清单

全面检验你的 AI 博士知识体系

Overall Progress 0 / 59 COMPLETED
📐
一、数学基础
13 ITEMS

1.1 线性代数

  • 矩阵分解(SVD、QR、特征分解)及应用场景
  • 线性变换的几何理解(旋转、缩放、投影)
  • 张量运算与广播机制

1.2 概率统计

  • 贝叶斯推断:先验、似然、后验
  • 常见分布及其性质(高斯、指数族、混合分布)
  • 假设检验与置信区间
  • MLE vs MAP 的区别与联系

1.3 优化理论

  • 梯度下降收敛性分析
  • 凸优化基础:凸集、凸函数、对偶
  • 常用优化器原理(Adam、AdamW、SGD+Momentum)

1.4 信息论

  • 熵、交叉熵、KL 散度的含义与联系
  • 互信息及其在 ML 中的应用
  • 信息论与机器学习的联系(信息瓶颈等)
Z
二、机器学习核心
11 ITEMS

2.1 统计学习理论

  • VC 维与泛化界的直观理解
  • Bias-Variance Trade-off 及其分解
  • 过拟合与正则化(L1/L2、Dropout、Early Stopping)

2.2 经典模型

  • 树模型原理(决策树、随机森林、GBDT/XGBoost)
  • SVM 与核方法
  • 概率图模型(HMM、CRF)

2.3 深度学习原理

  • 反向传播完整推导
  • 梯度消失/爆炸的成因与解决方案
  • BatchNorm vs LayerNorm 的本质区别
  • 注意力机制的数学本质与计算复杂度
  • 残差连接为何有效(梯度流角度)
🧠
三、大语言模型
15 ITEMS

3.1 架构

  • Transformer 完整前向传播推导
  • 注意力计算复杂度 O(n²) 及优化方法(Flash Attention)
  • 位置编码原理(Sinusoidal、RoPE、ALiBi)
  • 解码策略对比(Greedy、Beam、Top-k、Top-p、Temperature)

3.2 训练

  • Scaling Laws 的核心结论
  • 预训练数据配比、清洗、去重策略
  • 分布式训练基础(DP、TP、PP、ZeRO)
  • 涌现能力的现象与争议

3.3 对齐

  • RLHF 完整流程(SFT → RM → PPO)
  • PPO 算法核心思想与实现要点
  • DPO 及其变体(IPO、KTO、ORPO)
  • 安全与对齐的开放问题(越狱、奖励黑客)

3.4 推理与系统

  • KV Cache 原理与优化
  • 推理加速(投机解码、量化、投机采样)
  • 长上下文扩展技术(RoPE 外推、YaRN、Ring Attention)
🚀
四、前沿方向
11 ITEMS

4.1 多模态

  • 视觉-语言对齐(CLIP、BLIP)
  • 统一架构设计(Flamingo、GPT-4V 思路)
  • 多模态推理与 Chain-of-Thought
  • 视频理解与生成(Sora、VideoLLM)

4.2 强化学习

  • MDP 与 Bellman 方程
  • Policy Gradient 及其变体(REINFORCE、Actor-Critic)
  • Model-based RL 与世界模型
  • LLM + RL 结合(RLAIF、Process Reward Model)

4.3 具身智能

  • 机器人学习基础(模仿学习、强化学习)
  • Sim-to-Real 迁移
  • VLA(Vision-Language-Action)模型
🔬
五、研究方法论
9 ITEMS

5.1 问题发现

  • 如何判断问题的价值(增量 vs 本质创新)
  • 识别领域瓶颈与盲点
  • 从失败实验中提炼问题
  • 从实际应用场景反推研究问题
  • 区分"有趣"和"有用"的问题

5.2 文献驾驭

  • 快速阅读:先抓贡献和局限,再读细节
  • 批判性阅读:假设是否合理?实验是否充分?
  • 建立领域图谱:谁在做什么、流派分歧
  • 追踪前沿:arXiv、会议、关键作者
Progression automatically cached to local manifold