从迷茫到入门：我的LLM学习心路历程

最新推荐文章于 2026-06-20 20:55:32 发布

原创最新推荐文章于 2026-06-20 20:55:32 发布 · 379 阅读

3 ·

本内容遵循CC 4.0 BY-SA版权协议

GEO检测

标签

#学习 #人工智能 #ai

大模型专栏收录该内容

2 篇文章

订阅专栏

在第一篇文章中，我分享了项目的技术实现。今天，我想换个角度，聊聊我学习大语言模型的心路历程。从最初的迷茫困惑，到逐渐入门，再到能够独立开发应用，这一路上踩过的坑、学到的经验，希望能给同样在路上的朋友们一些启发。

前言

今天这篇文章，我想跳出技术细节，分享一些更"软"的东西：我的学习路径、踩过的坑、学到的经验，以及一些可能对你有用的学习方法。

---

为什么开始学习大模型？

第一次接触：ChatGPT的震撼

还记得第一次使用ChatGPT时，我被它的能力深深震撼了。它能理解我的问题，给出合理的回答，甚至能写代码、做翻译、写文章。那一刻，我意识到：AI的时代真的来了。

但震撼之后，我开始思考：
这背后的技术是什么？
我能不能也做出这样的应用？
大模型能解决我工作中的哪些问题？

从使用者到开发者

作为一名程序员，我意识到仅仅使用大模型是不够的。如果我想在这个AI时代保持竞争力，就必须理解它、掌握它、应用它。

于是，我决定深入学习大语言模型的应用开发。

---

我的学习路径

第一阶段：迷茫期（第1周）

什么都不知道，不知道从哪里开始

尝试的事情：
- 看了很多技术文章，但感觉都是碎片化的知识
- 尝试理解Transformer架构，但被各种数学公式劝退
- 想直接上手项目，但不知道如何开始

困惑：
- 大模型、LLM、GPT、Transformer...这些概念之间的关系是什么？
- 我需要从底层原理开始学，还是直接学应用？
- 那么多模型（GPT、Claude、通义千问），我该学哪个？

入门：
后来我意识到，对于应用开发者来说，不需要从底层原理开始。我应该：
1. 先理解大模型能做什么
2. 学会如何调用API
3. 通过实际项目来学习

第二阶段：入门期（第2-3周）

学习内容：
1. API调用基础
- 注册了通义千问、OpenAI等平台的账号
- 学会了基本的API调用
- 理解了Token、Temperature等基本概念

2. Prompt工程入门
- 学习了如何写Prompt
- 理解了Few-Shot Learning
- 学会了结构化Prompt的设计

3. 第一个小项目
- 做了一个简单的文本生成工具
- 虽然功能简单，但让我理解了整个流程

收获：
- 理解了"大模型应用开发"的本质：Prompt工程 + API调用 + 业务逻辑
- 学会了如何阅读官方文档
- 建立了学习的信心

第三阶段：实践期（第3-5周）

能够独立开发应用，但还在不断优化

学习内容：
1. 项目实战
- 开发了车辆电路图导航Chatbot（第一篇文章的项目）
- 从需求分析到部署上线，完整走了一遍

2. 深入理解
- 学习了对话状态管理
- 理解了多轮对话的设计
- 掌握了Prompt优化的技巧

3. 工程化实践
- 学会了错误处理和容错
- 理解了如何设计可维护的代码
- 掌握了性能优化的方法

---

踩过的坑，都是泪

坑1：过度关注底层原理

问题：
一开始，我花了很多时间学习Transformer架构、注意力机制等底层原理。虽然这些知识很有价值，但对于应用开发者来说，优先级不应该这么高。
- 对于应用开发者，应该**先学会用，再理解原理
- 底层原理可以在遇到具体问题时再深入学习
- 项目驱动学习比理论学习更有效

如果你也是应用开发者，建议的学习顺序：
1. 理解大模型能做什么
2. 学会API调用
3. 掌握Prompt工程
4. 通过项目实践
5. 遇到问题时再深入学习原理

坑2：Prompt设计过于复杂

问题：
刚开始写Prompt时，我总是想把所有规则都写进去，结果Prompt变得非常长、非常复杂。但效果并不好，LLM反而理解不了。

- 简洁比复杂更有效
- Few-Shot示例比长篇说明更有用
- 结构化、层次化的Prompt更容易被理解

改进：
# 不好的Prompt（过于复杂）
prompt = f
请分析用户查询：{user_query}
你需要：
1. 提取品牌信息，注意品牌可能是复合品牌，比如"东风天龙"不能拆分成"东风"和"天龙"
2. 提取型号信息，注意型号可能包含字母和数字
3. 提取电路图类型，注意类型可能有多种表达方式
4. 提取车辆类别，注意类别可能是工程机械、商用车等
5. 提取关键词，关键词是除了品牌、型号、类型、类别之外的其他重要信息
6. 计算置信度，置信度应该在0到1之间
...（还有很多规则）

好的Prompt（简洁、结构化）
prompt = f"""# 任务：车辆电路图查询意图理解

## 输入
用户查询：{user_query}

## 输出格式
只返回JSON：
{{
"brand": "品牌名称或null",
"model": "型号名称或null",
"diagram_type": "电路图类型或null",
"confidence": 0.0-1.0
}}

## 规则
1. 复合品牌必须完整返回："东风天龙" → "东风天龙"（不能只返回"东风"）
2. 品牌简称映射："天龙" → "东风天龙"

## 示例
输入：我要一个东风天龙的仪表图
输出：{{"brand": "东风天龙", "model": null, "diagram_type": "仪表电路图", "confidence": 0.9}}

开始解析："""

坑3：完全依赖LLM的输出

问题：
刚开始，我完全相信LLM的输出，没有做任何验证。结果发现：
- LLM有时会"编造"数据
- 输出格式不一致
- 品牌识别错误

教训：
- 永远不要完全信任LLM的输出
- 关键业务逻辑必须在代码层面验证
- 容错处理是必须的

最后的改进：
def parse_intent(self, user_query: str) -> IntentResult:
"""解析意图（带验证）"""
1. LLM解析
intent_dict = self._call_llm_for_intent(user_query)

2. 代码层面验证和修正
intent_result = self._validate_and_fix(intent_dict, user_query)

3. 强制规则执行
if "东风天龙" in user_query:
intent_result.brand = "东风天龙"   强制修正

return intent_result

---

学习方法总结

1. 项目驱动学习

不要只看教程，要通过实际项目来学习。

为什么有效：
- 项目有明确的目标，学习更有动力
- 遇到实际问题，学习更有针对性
- 完成项目有成就感，更容易坚持

我的实践：
- 第一个项目：简单的文本生成工具（学习API调用）
- 第二个项目：意图理解功能（学习Prompt工程）
- 第三个项目：完整的Chatbot（学习系统设计）

2. 从简单到复杂

不要一开始就做复杂的项目，从最简单的开始。

学习路径：
1. Hello Worl：调用API，得到响应
2. 简单应用：做一个文本生成工具
3. 中等应用：实现意图理解功能
4. 复杂应用：开发完整的对话系统

3. 多读官方文档

官方文档是最权威、最全面的学习资源。

我的经验：
- 通义千问的文档写得很好，有详细的示例
- OpenAI的文档也很全面，有很多最佳实践
- 不要只看中文资料，英文文档往往更新更快

推荐资源：
- 通义千问：https://help.aliyun.com/zh/model-studio/
- OpenAI：https://platform.openai.com/docs
- Prompt Engineering Guide：https://www.promptingguide.ai/