写在前面
这篇文章了收集了NLP方向常见的基础八股,跟我一起背起来吧!针对LLM算法岗位,欢迎评论补充。
八股准备
-
模型结构
-
模型细节:
-
手撕系列:
-
加速计算:
-
模型训练:
- AI大模型大厂面经——LoRA面试题最全总结 + LORA变体 + DORA+PEFT
- 从SGD到AdamW,优化器详解
- 强化学习中的奇怪概念(一)——On-policy与off-policy+PPO直观理解+ 从PPO,DPO到GROP+ [详解Qwen3-GSPO和DeepSeek-GRPO两大强化学习算法的区别]+新版 Qwen3 的强化学习新方案:Qwen3-GSPO(https://zhuanlan.zhihu.com/p/1932791271363154917)
-
其它:

5815

被折叠的 条评论
为什么被折叠?



