LLM (大模型) 从模型结构到推理到训练的底层原理到应用落地的全栈剖析


🚀 大语言模型(LLM)全栈技术学习路线与博客汇总

大家好!近段时间我系统性地梳理了大语言模型(LLM)的全栈技术栈,从最基础的常用术语扫盲、Transformer底层网络结构(细化到公式),到上层应用的 RAG、Agent 智能体开发,再到后训练算法(SFT、PEFT、强化学习)与推理部署加速策略,累计输出了 37 篇 学习笔记与技术解析。

为了方便大家查阅和系统性学习,我将这些文章整理成了这份学习路线与导航指南。无论是刚刚入局的初学者,还是希望深入研究微调和Agent架构的开发者,都可以按图索骥,找到你需要的内容。

建议大家收藏本页,我会随着技术的迭代持续更新这篇导航!


🧱 模块一:夯实根基 —— LLM 基础理论与核心原理

万丈高楼平地起。这一模块带你从最基本的术语概念入手,深入理解 PyTorch、Transformer 底层原理以及大模型的推理机制。


🔍 模块二:知识外挂 —— 检索增强生成 (RAG) 进阶体系

解决大模型“幻觉”与知识时效性问题的杀手锏。本模块从 RAG 发展史讲起,全面覆盖检索算法、向量数据库及前沿的 GraphRAG 和评估框架。


🤖 模块三:智能体之魂 —— Agent 核心技术与前沿范式

让大模型拥有“手”和“脑”。本模块详细拆解了当下主流的单智能体与多智能体架构,教你如何让 LLM 具备规划、反思与工具调用能力。


⚒️ 模块四:炼丹实战 —— 后训练、微调与推理部署

走向底层硬核技术。这一模块专为想要自己“炼丹”和部署开源模型的同学准备,涵盖微调理论、强化学习对齐策略及工程化部署加速。


💬 写在最后:
大模型技术仍在飞速迭代,学习它是一个持续输入与打破认知的过程。初接触时我们或许容易陷入“达克效应”,觉得调通几个 API,开发了几个skill, 搭建了几个 agent 就窥见了全貌;
但随着逐步深入应用落地,发现不得不了解更多底层架构与算法,反而越学越会生出一种“如履薄冰”的敬畏感。

希望这套系列文章能帮大家建立起最基础的体系化的基本认知框架,扎实地向深水区迈进。如果在阅读中有任何问题或灵感,欢迎在评论区留言探讨!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值