收藏必看:35岁程序员如何抓住AI浪潮,突破职业瓶颈,开启高薪新赛道
当ChatGPT自动生成精准代码片段,当Copilot实时辅助开发流程,人工智能(AI)的技术革命已从概念落地为产业动能。从智能医疗的影像诊断系统,到自动驾驶的决策中枢,再到金融行业的智能风控模型,AI正以每月迭代的速度重构产业生态,催生全新的生产力范式。这股浪潮对程序员群体而言,既是"替代性"冲击的挑战,更是跨越年龄门槛的机遇——2024年国内AI相关岗位招聘量同比激增74%,核心岗位平均薪资较传统开发高出30%,为深陷35+焦虑的程序员打开了新的职业出口。
35岁,正成为程序员职业道路上的一道"隐形门槛"。企业对技术岗位的年龄偏好愈发明显,部分互联网公司的"优化名单"中35岁以上从业者占比居高不下,求职市场上"35岁以下"的招聘要求更是屡见不鲜。长期深耕业务代码的程序员,既面临基础开发岗位被AI工具替代的风险,又承受着精力与学习能力不如年轻从业者的心理压力。但值得关注的是,AI领域的核心岗位恰恰需要"技术沉淀"——程序员多年积累的编程逻辑、工程经验,正是转型AI的核心优势。
本文将聚焦35岁程序员的转型痛点,从转型优劣势拆解、高适配岗位分析、分阶段学习路径、系统知识图谱到实战落地建议,构建一套可直接复用的转型方案。无论你是后端开发、前端工程师还是运维人员,都能从中找到适配的转型方向。

一、转型AI:35+程序员的优劣势透视
35岁程序员转型AI,并非从零开始的"跨界",而是技术能力的"迁移升级"。清晰认知自身优劣势,是精准规划转型路径的前提。
核心优势:多年积累的"隐形资产"
- 工程化能力壁垒:相较于刚毕业的应届生,35+程序员普遍具备百万级代码量的开发经验,精通Python、Java等主流语言(其中Python是AI开发的核心工具),对数据结构、算法逻辑的理解更为深刻。这种工程化能力能快速迁移到AI模型开发中——比如用软件工程思维优化TensorFlow模型的代码结构,用调试经验解决PyTorch的训练bug,这正是MLOps等岗位最看重的能力。
- 问题拆解实战经验:长期参与业务项目的经历,让程序员养成了"从需求到落地"的完整思维闭环。在AI项目中,这种能力直接转化为数据清洗的效率、模型优化的方向判断——例如面对电商推荐系统的需求,能快速拆解为用户行为数据采集、特征工程、模型选型、部署监控等环节,这是仅掌握理论的年轻从业者难以企及的。
- 业务场景认知优势:35岁左右的程序员往往深度参与过金融、医疗、电商等特定领域的开发,熟悉行业痛点与业务逻辑。而AI技术的落地核心在于"技术适配业务",比如有金融风控系统开发经验的程序员,转型AI风控模型开发时,能快速理解"反欺诈规则与机器学习模型的结合点",降低跨领域学习成本。
- 时间管理与自律性:相较于年轻从业者,35+程序员更能平衡工作与学习的关系,具备更强的目标导向性。在AI学习中,这种特质能有效规避"贪多求全"的误区,聚焦核心技能突破。
主要劣势:需要突破的"能力瓶颈"
- 数学基础断层:AI的核心是"用数学解决问题",线性代数的矩阵运算、概率统计的分布模型、微积分的梯度下降原理,都是模型开发的基础。但多数程序员长期专注于应用开发,数学知识存在不同程度的遗忘,这会导致学习深度学习时"知其然不知其所以然"——比如能调用PyTorch的API训练模型,却无法解释损失函数下降的数学逻辑。
- 学习精力分散:35+程序员往往承担家庭与工作的双重压力,整块学习时间较少,容易陷入"学了就忘"的循环。而AI技术更新速度快,从Transformer到Diffusion模型,从大语言模型到多模态技术,需要持续跟进前沿动态,精力分配成为重要挑战。
- 领域知识盲区:AI岗位高度细分,如NLP需要语言学基础,CV需要图像处理知识,医疗AI需要了解医学影像标准。程序员若缺乏特定领域知识,在岗位竞争中会处于劣势——例如同样申请医疗AI算法岗,有医学影像系统开发经验的程序员,需额外补充医学术语与影像诊断逻辑。
- 年轻群体竞争压力:AI领域吸引了大量985高校的硕士、博士及海外留学生,他们具备扎实的理论基础,且薪资期望相对灵活。35+程序员需通过"工程经验+实战项目"形成差异化竞争,避免与年轻从业者比拼理论深度。
二、高适配岗位清单:35+程序员的转型优选
结合35+程序员的能力特质,推荐以下5类岗位,这些岗位既能发挥工程经验优势,又能降低转型难度,薪资水平均处于行业上游。
1. 机器学习工程师:转型门槛最低的"过渡岗"
- 核心职责:聚焦业务场景的模型落地,包括数据预处理、特征工程、基础模型训练与优化,以及模型部署后的性能调优。与AI算法工程师相比,更侧重"工程实现"而非"算法创新"。
- 适配理由:需大量运用编程与工程化能力,数学要求以基础应用为主,适合有Python开发经验的程序员快速切入。例如后端程序员可利用API开发经验,将训练好的模型封装为RESTful接口供业务系统调用。
- 技能要求:Python(NumPy、Pandas)、Scikit-learn、TensorFlow/PyTorch基础,熟悉线性回归、决策树、SVM等经典算法,掌握数据清洗与特征选择方法。
- 竞争特点:岗位需求量最大,招聘方更看重项目落地能力而非学历,35+程序员的工程经验是核心优势。
- 薪资范围:国内初级20K-30K/月,中级30K-45K/月,高级50K-70K/月(一线城市)。
2. MLOps工程师:工程经验的"价值放大器"
- 核心职责:搭建机器学习流水线,实现模型开发、训练、部署、监控的全流程自动化,解决"模型从实验室到生产环境"的落地问题,比如用Docker封装模型,用Kubernetes实现弹性扩展。
- 适配理由:核心能力要求为"DevOps+AI基础",后端、运维、架构师背景的程序员可无缝迁移技术栈。例如有Docker容器化经验的运维工程师,只需补充MLflow等MLOps工具的使用,即可快速转型。
- 技能要求:Linux系统、Docker、Kubernetes、CI/CD工具(Jenkins/GitLab CI),熟悉至少一种云计算平台(AWS/Azure/阿里云),了解TensorFlow Serving或TorchServe的模型部署方法。
- 竞争特点:复合型人才缺口大,多数从业者为"DevOps转型"或"AI工程师转型",35+程序员的系统架构经验具备独特优势。
- 薪资范围:国内25K-50K/月,头部企业核心岗位可达60K+。
3. 数据科学家(业务方向):业务经验的"转化岗"
- 核心职责:基于业务需求进行数据挖掘与分析,构建预测模型并输出业务洞见,例如电商平台的用户流失预测、金融机构的信用评分模型构建。与技术方向数据科学家相比,更侧重"业务解读"而非"算法深度"。
- 适配理由:35+程序员熟悉业务流程,能快速定位数据与业务的关联点。例如有电商订单系统开发经验的程序员,在做用户购买行为分析时,能精准理解订单状态、支付流程等数据背后的业务逻辑。
- 技能要求:Python(Pandas、Matplotlib)、SQL(复杂查询与存储过程)、统计学基础(假设检验、回归分析),熟悉Tableau或Power BI等可视化工具,具备业务需求拆解能力。
- 竞争特点:行业垂直属性强,金融、电商等领域有业务经验的从业者更受青睐,年龄敏感度低于纯技术岗位。
- 薪资范围:国内18K-40K/月,金融行业可达45K+。
4. AI产品经理(技术型):技术与业务的"桥梁岗"
- 核心职责:主导AI产品的需求定义、技术选型与落地推进,协调算法、开发、业务团队的协作,例如智能客服产品中对话模型的功能规划、性能指标设定。
- 适配理由:程序员具备技术背景,能快速理解AI技术的可行性边界,避免提出"技术无法实现"的需求。同时,多年的开发经验让其能与算法工程师高效沟通,减少"需求传递偏差"。
- 技能要求:了解AI核心技术(机器学习、NLP/CV基础),掌握产品设计工具(Axure、Figma),具备PRD撰写与项目管理能力,熟悉敏捷开发流程。
- 竞争特点:技术型AI产品经理稀缺,纯产品背景从业者难以替代,35+的行业认知是重要加分项。
- 薪资范围:国内20K-50K/月,头部AI企业可达70K+。
5. AI算法工程师(应用方向):技术深耕的"进阶岗"
- 核心职责:基于开源算法进行二次开发与优化,适配特定业务场景,例如将BERT模型优化为适用于客服对话的轻量模型,将YOLO算法调整为适配工业质检的高精度模型。区别于科研型算法岗,不要求原创算法研发。
- 适配理由:适合有算法基础或对特定领域有热情的程序员,35+的工程经验能帮助快速解决算法落地中的工程问题,如模型推理速度优化、内存占用降低。
- 技能要求:扎实的Python编程能力,精通TensorFlow/PyTorch,深入理解CNN、Transformer等核心网络结构,熟悉至少一个细分领域(NLP/CV/推荐系统)的主流算法。
- 竞争特点:对技术深度要求较高,但允许通过项目经验弥补理论差距,适合愿意持续深耕技术的程序员。
- 薪资范围:国内30K-60K/月,头部企业核心岗位可达80K+。
三、分阶段学习路径:35+程序员的高效进阶方案
结合35+程序员"时间碎片化、目标导向强"的特点,设计"基础夯实-技能聚焦-实战突破"三阶段学习路径,每个阶段明确核心目标与可落地的学习方法,避免无效投入。
通用基础阶段(1-3个月):搭建AI知识框架
无论选择哪个岗位,此阶段均需完成数学基础与工具能力的铺垫,核心是"唤醒旧知识、掌握核心工具"。
- 数学基础:聚焦"实用化"而非"理论化",重点复习线性代数(矩阵运算、特征值)、概率统计(正态分布、期望、假设检验)、微积分(导数、梯度)。推荐资源:Khan Academy数学课程(B站有中文字幕)、《深入浅出统计学》(侧重应用案例)、3Blue1Brown线性代数可视化视频(帮助建立直观认知)。学习方法:每天30分钟,结合AI场景理解——例如用梯度下降的数学逻辑解释"模型如何通过迭代优化损失"。
- 核心工具:精通Python数据处理库,包括NumPy(数组运算)、Pandas(数据清洗与分析)、Matplotlib(基础可视化)。掌握SQL复杂查询(关联查询、窗口函数)。推荐资源:Python官方文档(重点看数据结构部分)、LeetCode数据库题目(每天1题,强化SQL能力)。学习方法:用实际数据集练习,例如 Kaggle的泰坦尼克号数据集,完成数据清洗、缺失值处理、特征分析全流程。
- AI通识:了解机器学习与深度学习的基本概念,区分监督学习、无监督学习、强化学习的适用场景。推荐资源:Coursera安德鲁·吴《机器学习》课程(前4周内容)、李沐《动手学深度学习》前3章。学习方法:做思维导图梳理核心概念,如"分类问题与回归问题的区别"“机器学习与深度学习的关系”。
岗位聚焦阶段(3-6个月):针对性突破核心技能
根据选定岗位,聚焦该领域的核心技能,此阶段需"学练结合",每学习一个知识点就完成对应的实践任务。
1. 机器学习工程师聚焦技能
- 算法学习:掌握线性回归、逻辑回归、决策树、随机森林、SVM等经典算法的原理与应用场景,理解过拟合、欠拟合的解决方法(正则化、交叉验证)。推荐资源:Scikit-learn官方文档(算法部分)、《机器学习实战》(动手实现算法)。
- 框架应用:入门TensorFlow或PyTorch,掌握模型构建、训练、评估的基本流程。推荐资源:PyTorch官方教程(60分钟快速入门)、TensorFlow实战案例(MNIST手写数字识别)。
- 实践任务:完成Kaggle房价预测项目(使用Scikit-learn)、用PyTorch实现MNIST数据集分类,重点练习特征工程与模型调优。
2. MLOps工程师聚焦技能
- 工程工具:深入学习Docker(容器构建与管理)、Kubernetes(集群调度)、CI/CD工具(GitLab CI)。推荐资源:Docker官方文档、阿里云容器服务教程。
- MLOps工具链:掌握MLflow(实验跟踪与模型管理)、TensorFlow Serving(模型部署)、Prometheus(模型监控)。推荐资源:MLflow官方文档、《MLOps工程实践》。
- 实践任务:用Docker封装一个PyTorch模型,通过MLflow记录训练参数,搭建"代码提交-自动训练-模型部署"的简易CI/CD流水线。
3. 数据科学家(业务方向)聚焦技能
- 分析能力:掌握数据可视化进阶(Seaborn、Tableau)、用户画像构建方法、漏斗分析与留存分析模型。推荐资源:Tableau官方培训课程、《数据分析实战》。
- 模型应用:重点学习回归分析、分类算法在业务中的应用,如用户流失预测、销量预测。推荐资源:《Python数据科学手册》(模型应用部分)。
- 实践任务:用电商用户行为数据(Kaggle可下载)构建用户画像,分析不同画像用户的购买偏好;用外卖平台订单数据做销量预测,输出业务优化建议。
4. AI产品经理(技术型)聚焦技能
- AI认知:了解NLP(对话系统、文本分析)、CV(图像识别、目标检测)的技术边界与落地难点。推荐资源:《AI产品经理实战》、极客时间《AI产品经理入门》。
- 产品能力:掌握PRD撰写方法(重点是AI产品的功能描述与性能指标定义)、用户调研与需求分析技巧。推荐资源:Axure官方教程、《启示录:打造用户喜爱的产品》。
- 实践任务:撰写智能客服产品的PRD,明确对话准确率、响应时间等核心指标;分析ChatGPT的产品逻辑,输出"企业级智能助手"的功能规划方案。
5. AI算法工程师(应用方向)聚焦技能
- 算法深度:深入学习CNN(图像分类)、Transformer(文本处理)的网络结构,理解BERT、YOLO等经典模型的原理与优化方法。推荐资源:李沐《动手学深度学习》(进阶章节)、ArXiv论文解读(关注机器之心、新智元等公众号)。
- 模型优化:掌握模型量化、剪枝等轻量化技术,解决部署中的性能问题。推荐资源:TensorRT官方文档、《深度学习模型压缩与加速》。
- 实践任务:基于BERT实现文本分类(如情感分析),并通过量化优化模型推理速度;用YOLO实现工业零件缺陷检测,调整参数提升检测精度。
实战突破阶段(6-12个月):用项目打造竞争力
35+程序员的转型核心是"用实战证明能力",此阶段需完成2-3个高质量项目,形成可展示的作品集(GitHub+个人博客),为求职加分。
- 项目选择原则:① 贴近目标岗位业务场景(如申请金融AI岗,选择风控相关项目);② 包含完整流程(数据获取-模型开发-部署落地);③ 突出工程亮点(如高并发场景的模型优化、复杂业务的需求拆解)。
- 项目来源渠道:Kaggle竞赛(侧重数据科学)、天池竞赛(国内场景丰富)、GitHub开源项目二次开发(侧重工程实现)、模拟企业场景(如基于公开数据构建智能推荐系统)。
- 作品集打造:每个项目需包含详细文档,说明项目背景、技术选型理由、核心难点与解决方法、性能指标与优化空间。例如MLOps项目,需展示流水线架构图、自动化部署流程、监控指标面板;AI产品项目,需展示PRD文档、用户调研报告、产品原型。
- 行业资源对接:参与AI社区活动(如DataFun、AI前线沙龙),加入技术交流群,尝试对接小型企业的AI落地需求(如帮助传统企业搭建简单的客户分类模型),积累真实项目经验。
四、AI知识图谱:系统梳理学习内容
以下知识图谱按"基础层-技术层-应用层"划分,35+程序员可根据目标岗位,聚焦对应模块的核心内容,避免学习范围过宽。
1. 基础层:转型的"地基"
| 知识模块 | 核心内容 | 学习重点 | 推荐资源 |
|---|---|---|---|
| 数学基础 | 线性代数、概率统计、微积分 | 矩阵运算、概率分布、梯度下降 | Khan Academy、《深入浅出统计学》 |
| 编程工具 | Python、SQL、开发工具 | NumPy、Pandas、复杂SQL查询 | Python官方文档、LeetCode数据库题库 |
| AI通识 | 机器学习、深度学习基本概念 | 算法分类、技术边界、落地流程 | 安德鲁·吴《机器学习》、李沐入门课程 |
2. 技术层:岗位的"核心技能"
| 岗位方向 | 核心技术模块 | 重点学习内容 | 实践工具 |
|---|---|---|---|
| 机器学习工程师 | 经典算法、模型开发 | 回归、分类算法、特征工程 | Scikit-learn、TensorFlow/PyTorch |
| MLOps工程师 | 工程工具、流水线搭建 | Docker、K8s、模型部署与监控 | MLflow、TensorFlow Serving、Prometheus |
| 数据科学家 | 数据分析、可视化、业务建模 | 用户画像、预测模型、业务解读 | Tableau、Seaborn、Pandas |
| AI产品经理 | AI技术认知、产品设计 | 技术边界、PRD撰写、需求拆解 | Axure、Figma、Project |
| AI算法工程师 | 深度学习、模型优化 | CNN、Transformer、模型轻量化 | PyTorch、TensorRT、BERT源码 |
3. 应用层:落地的"场景载体"
- 金融领域:智能风控(信用评分、反欺诈)、量化交易、智能投顾——核心是数据安全性与模型可解释性。
- 医疗领域:医学影像诊断(CT/MRI识别)、电子病历分析、药物研发辅助——核心是模型精度与医学合规性。
- 电商领域:智能推荐系统、用户画像、销量预测——核心是模型实时性与业务转化率。
- 工业领域:设备故障预测、产品质量检测(机器视觉)、生产流程优化——核心是模型稳定性与边缘部署能力。
五、35+转型实战建议:避开坑点,高效突破
- 精准定位,拒绝"全栈幻想":AI领域细分度极高,不要试图同时学习NLP、CV、推荐系统多个方向。建议根据过往业务经验选择细分场景——例如做过支付系统的程序员,优先选择金融AI方向;做过电商系统的,聚焦推荐系统或用户分析。
- 碎片化时间高效利用:将学习内容拆解为"15分钟小任务",例如通勤时听AI技术播客(如《硬科技创业》),午休时看1个PyTorch小案例,睡前梳理当天学习的核心知识点。避免追求"整块时间",防止因工作加班导致学习中断。
- 用"工程思维"学AI:35+程序员无需像应届生那样死磕数学理论,可采用"问题驱动"的学习方式——例如遇到模型收敛慢的问题,再回头学习学习率调整的数学原理;需要优化模型性能时,再深入研究批量归一化的作用。这种方式能快速建立"知识与应用"的关联。
- 打造差异化竞争力:求职时突出"传统开发+AI技术"的复合优势,例如在简历中强调"10年后端开发经验,擅长将AI模型快速集成到业务系统";面试时主动分享"用工程方法解决AI落地问题"的案例,如"通过缓存优化,将推荐模型的响应时间从500ms降至50ms"。
- 持续跟进前沿,但不盲目追新:AI技术更新快,大语言模型、多模态技术等热点不断。建议每周花1小时浏览AI领域资讯(如机器之心、ArXiv每日论文),重点关注技术在行业中的落地案例,而非单纯追逐理论创新。例如关注GPT在客服场景的应用方法,而非深入研究Transformer的数学推导。
- 拓展人脉,获取内推机会:35+程序员通过社招投递简历,容易因年龄被HR筛选掉。建议主动加入AI技术社群(如GitHub、知乎AI话题群),关注行业专家(如李沐、何恺明)的社交账号,参与线下技术沙龙,通过技术交流获取内推机会,绕过简历筛选环节。
六、总结:35+,正是转型AI的黄金期
35岁并非职业的"天花板",而是技术沉淀后的"新起点"。AI浪潮带来的不是"程序员的终结",而是"程序员的升级"——那些重复性的基础开发工作会被AI工具替代,但需要"技术+经验+业务"复合能力的AI岗位,正迫切需求有多年工程沉淀的35+从业者。
你多年积累的编程基础、工程经验、业务认知,都是转型AI的宝贵财富。相较于年轻从业者,你更清楚技术落地的痛点,更擅长平衡技术与业务的关系,这正是AI领域最稀缺的能力。
从今天开始,选定一个方向,从基础工具学起,用一个小项目启动实战,逐步构建自己的AI知识体系与作品集。转型之路或许充满挑战,但只要保持目标导向、持续实践,35+的你一定能在AI浪潮中,开启职业生涯的新篇章。
普通人如何抓住AI大模型的风口?
为什么要学习大模型?
在DeepSeek大模型热潮带动下,“人工智能+”赋能各产业升级提速。随着人工智能技术加速渗透产业,AI人才争夺战正进入白热化阶段。如今近**60%的高科技企业已将AI人才纳入核心招聘目标,**其创新驱动发展的特性决定了对AI人才的刚性需求,远超金融(40.1%)和专业服务业(26.7%)。餐饮/酒店/旅游业核心岗位以人工服务为主,多数企业更倾向于维持现有服务模式,对AI人才吸纳能力相对有限。

这些数字背后,是产业对AI能力的迫切渴求:互联网企业用大模型优化推荐算法,制造业靠AI提升生产效率,医疗行业借助大模型辅助诊断……而餐饮、酒店等以人工服务为核心的领域,因业务特性更依赖线下体验,对AI人才的吸纳能力相对有限。显然,AI技能已成为职场“加分项”乃至“必需品”,越早掌握,越能占据职业竞争的主动权
随着AI大模型技术的迅速发展,相关岗位的需求也日益增加。大模型产业链催生了一批高薪新职业:

人工智能大潮已来,不加入就可能被淘汰。如果你是技术人,尤其是互联网从业者,现在就开始学习AI大模型技术,真的是给你的人生一个重要建议!
如果你真的想学习大模型,请不要去网上找那些零零碎碎的教程,真的很难学懂!你可以根据我这个学习路线和系统资料,制定一套学习计划,只要你肯花时间沉下心去学习,它们一定能帮到你!
大模型全套学习资料领取
这里我整理了一份AI大模型入门到进阶全套学习包,包含学习路线+实战案例+视频+书籍PDF+面试题+DeepSeek部署包和技巧,需要的小伙伴文在下方免费领取哦,真诚无偿分享!!!
vx扫描下方二维码即可

部分资料展示
一、 AI大模型学习路线图
这份路线图以“阶段性目标+重点突破方向”为核心,从基础认知(AI大模型核心概念)到技能进阶(模型应用开发),再到实战落地(行业解决方案),每一步都标注了学习周期和核心资源,帮你清晰规划成长路径。

二、 全套AI大模型应用开发视频教程
从入门到进阶这里都有,跟着老师学习事半功倍。

三、 大模型学习书籍&文档
收录《从零做大模型》《动手做AI Agent》等经典著作,搭配阿里云、腾讯云官方技术白皮书,帮你夯实理论基础。

四、大模型大厂面试真题
整理了百度、阿里、字节等企业近三年的AI大模型岗位面试题,涵盖基础理论、技术实操、项目经验等维度,每道题都配有详细解析和答题思路,帮你针对性提升面试竞争力。

适用人群

第一阶段(10天):初阶应用
该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。
- 大模型 AI 能干什么?
- 大模型是怎样获得「智能」的?
- 用好 AI 的核心心法
- 大模型应用业务架构
- 大模型应用技术架构
- 代码示例:向 GPT-3.5 灌入新知识
- 提示工程的意义和核心思想
- Prompt 典型构成
- 指令调优方法论
- 思维链和思维树
- Prompt 攻击和防范
- …
第二阶段(30天):高阶应用
该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。
- 为什么要做 RAG
- 搭建一个简单的 ChatPDF
- 检索的基础概念
- 什么是向量表示(Embeddings)
- 向量数据库与向量检索
- 基于向量检索的 RAG
- 搭建 RAG 系统的扩展知识
- 混合检索与 RAG-Fusion 简介
- 向量模型本地部署
- …
第三阶段(30天):模型训练
恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。
到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?
- 为什么要做 RAG
- 什么是模型
- 什么是模型训练
- 求解器 & 损失函数简介
- 小实验2:手写一个简单的神经网络并训练它
- 什么是训练/预训练/微调/轻量化微调
- Transformer结构简介
- 轻量化微调
- 实验数据集的构建
- …
第四阶段(20天):商业闭环
对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。
- 硬件选型
- 带你了解全球大模型
- 使用国产大模型服务
- 搭建 OpenAI 代理
- 热身:基于阿里云 PAI 部署 Stable Diffusion
- 在本地计算机运行大模型
- 大模型的私有化部署
- 基于 vLLM 部署大模型
- 案例:如何优雅地在阿里云私有部署开源大模型
- 部署一套开源 LLM 项目
- 内容安全
- 互联网信息服务算法备案
- …
学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。
如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。
这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

更多推荐



所有评论(0)