书生浦语第二期实战营系列—综述加技术报告研读
书生浦语第二期实战营系列—Tutorial1:demo体验
书生浦语第二期实战营系列—Tutorial2:RAG
书生浦语第二期实战营系列—Tutorial3:Xtuner微调
书生浦语第二期实战营系列—Tutorial4:Lmdeploy量化部署
书生浦语第二期实战营系列—Tutorial5:Agent
书生浦语第二期实战营系列—Tutorial6:OpenCompass
书生浦语第二期实战营学习笔记(作业)(第四节课)
1 Finetune和xtuner简介
1.1 Finetune基础
1.1.1 Finetune的两种范式
根据微调的目的,主要分为两种
1.增量预训练微调
2.指令跟随微调

1.1.2 Finetune的三种方式
1.全量微调
2.Lora
3.Qlora

1.1.3 Finetune的数据格式

1.2 Finetune工具XTuner
1.2.1 XTuner简介

1.2.2 XTuner加速手段
1.多数据拼接

2.使用Flash Attention和DeepSpeed

1.2.3 XTuner常用命令

1.2.4 XTuner数据处理

2 微调模型
2.1 拉取代码
# 拉取 0.1.17 的版本源码
git clone -b v0.1.17 https://github.com/InternLM/xtuner
# 进入源码目录
cd xtuner
# 从源码安装 XTuner
pip install -e '.[all]'
#准备数据
使用tutorial中的示例
[
{
"conversation": [
{
"input": "请介绍一下你自己",
"output": "我是{}的小助手,内在是上海AI实验室书生·浦语的1.8B大模型哦"
}
]
}
]
脚本
import json
# 输入你的名字
name = '您的宠物百科知识'
# 重复次数
n = 10000
data = [
{
"conversation": [
{
"input": "请做一下自我介绍",
"output": "我是{}小助手,内在是上海AI实验室书生·浦语的1.8B大模型哦".format

本文详细介绍了书生浦语第二期实战营中的技术内容,包括Finetune的基础概念、XTuner的使用方法、模型微调步骤、多模态微调实战以及如何将模型上传到OpenXLab并部署。涵盖了Finetune的不同范式、工具及命令行操作,以及在实际项目中的应用案例。
(第四节课)&spm=1001.2101.3001.5002&articleId=137180689&d=1&t=3&u=806aa803075d4b38a881848fb8f948dc)
9583

被折叠的 条评论
为什么被折叠?



