Datawhale出品：《GLM-4 大模型部署微调教程》发布！

Datawhale

1091人浏览 · 2024-06-06 22:00:27

Datawhale · 2024-06-06 22:00:27 发布

Datawhale开源

开源贡献：Datawhale self-llm团队

前言

就在昨天，智谱 AI 发布了最新开源模型 GLM4,通过 10T 高质量多语言数据与更先进的训练技术,达到了更加出色的生成效果。

在仅有 9B 参数的前提下，在中文能力、长文本能力以及工具调用等任务中达到了更加出色的效果。

更多测评细节详见：

GLM-4最新开源版本硬核测评！Datawhale成员万字测评（一）

开发者视角看GLM-4-9B！Datawhale成员万字测评（二）

教程介绍

秉承开源贡献的宗旨，Datawhale团队成员在模型发布 12 小时 之内，为编写了GLM-4整套教学流程，包括：

模型 api 部署；
Langchain 接入；
WebDemo 部署；
vLLM 部署；
LoRA 高效指令微调。

教程除提供过程代码外，还贴心为学习者提供了训练数据与 Autodl 环境镜像，方便学习者一键运行！！

项目地址:

https://github.com/datawhalechina/self-llm/tree/master/GLM-4

目前项目已被智谱官方推荐学习：

这里我们抽取一部分内容供大家了解本次教程~

LoRA 高效指令微调

首先通过分析子词嵌入模板，从而构造指令微调数据。教程通过对模板编码前后进行可视化复查，并逐一检查特殊子词编号，从而确保嵌入对应。

进而通过对模型层级分析，判断高阶矩阵位置，从而使用 PEFT 工具对低秩转换层进行指定，开启 LoRA 微调。

最终查看微调效果:

User: 小姐，别的秀女都在求中选，唯有咱们小姐想被撂牌子，菩萨一定记得真真儿的——

Assistant: 菩萨也会看错眼的时候。

项目介绍

《开源大模型食用指南》是一个围绕开源大模型、针对国内初学者、基于 AutoDL 平台的中国宝宝专属大模型教程，针对各类开源大模型提供包括环境配置、本地部署、高效微调等技能在内的全流程指导，简化开源大模型的部署、使用和应用流程，让更多的普通学生、研究者更好地使用开源大模型，帮助开源、自由的大模型更快融入到普通学习者的生活中。

除 GLM4 外，项目已支持 LLama3, InternLM, Qwen1.5 等 20 项开源模型全流程教程，并且，本项目代码全部开源！！一并配置示例训练数据,AutoDL 环境镜像等,方便学习者使用！

目前项目已经收获 4930 star~ 屡次登上 Github Trending 榜

如果喜欢的话也请给我们加一颗星，为开源助力(^▽^)

文章最后

最后，由于贡献者团队时间仓促、精力有限，教程难免有些疏漏甚至错误，我们期望学习者在学习的同时，也能积极给我们建议，或者直接对项目进行贡献，让我们共同打磨教程，为后面的学习者提供更好的内容。

项目地址:

https://github.com/datawhalechina/self-llm/tree/master/GLM-4

开源贡献，点赞在看↓

魔乐社区

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

小参数・大码力・易部署 | Qwen3.6-27B上线魔乐社区，基于昇腾的部署教程来了

继一周前模型开源发布后，千问再度开源Qwen3.6-27B —— 一个拥有270亿参数的稠密多模态模型，也是社区呼声最高的模型规格。Qwen3.6-27B 依然支持多模态思考与非思考模式，在智能体编程方面达到了旗舰级表现，全面超越前代开源旗舰 Qwen3.5-397B-A17B（总参数397B / 激活参数17B的MoE模型）。作为稠密架构，它无需MoE路由即可部署，是开发者在实用、可广泛部署规模