书生浦语第二期实战营学习笔记（作业）（第四节课）

原创

已于 2024-04-30 11:26:36 修改 · 1.5k 阅读

标签

#学习 #笔记

于 2024-04-19 14:59:14 首次发布

本文详细介绍了书生浦语第二期实战营中的技术内容，包括Finetune的基础概念、XTuner的使用方法、模型微调步骤、多模态微调实战以及如何将模型上传到OpenXLab并部署。涵盖了Finetune的不同范式、工具及命令行操作，以及在实际项目中的应用案例。

书生浦语第二期实战营系列—综述加技术报告研读
 书生浦语第二期实战营系列—Tutorial1：demo体验
 书生浦语第二期实战营系列—Tutorial2：RAG
书生浦语第二期实战营系列—Tutorial3：Xtuner微调
 书生浦语第二期实战营系列—Tutorial4：Lmdeploy量化部署
 书生浦语第二期实战营系列—Tutorial5：Agent
书生浦语第二期实战营系列—Tutorial6：OpenCompass

书生浦语第二期实战营学习笔记（作业）（第四节课）

1 Finetune和xtuner简介
2 微调模型
3 将自我认知的模型上传到 OpenXLab，并将应用部署到 OpenXLab（进阶作业）
4 多模态微调（进阶作业）
附录

1 Finetune和xtuner简介

1.1 Finetune基础

1.1.1 Finetune的两种范式

根据微调的目的，主要分为两种
1.增量预训练微调
2.指令跟随微调
请添加图片描述

1.1.2 Finetune的三种方式

1.全量微调
2.Lora
3.Qlora
请添加图片描述

1.1.3 Finetune的数据格式

请添加图片描述

1.2 Finetune工具XTuner

1.2.1 XTuner简介

请添加图片描述

1.2.2 XTuner加速手段

1.多数据拼接
请添加图片描述
2.使用Flash Attention和DeepSpeed

1.2.3 XTuner常用命令

请添加图片描述

1.2.4 XTuner数据处理

请添加图片描述

2 微调模型

2.1 拉取代码

# 拉取 0.1.17 的版本源码
git clone -b v0.1.17  https://github.com/InternLM/xtuner

# 进入源码目录
cd xtuner

# 从源码安装 XTuner
pip install -e '.[all]'

#准备数据
使用tutorial中的示例

[
    {
   
   
        "conversation": [
            {
   
   
                "input": "请介绍一下你自己",
                "output": "我是{}的小助手，内在是上海AI实验室书生·浦语的1.8B大模型哦"
            }
        ]
    }
]

脚本

import json

# 输入你的名字
name = '您的宠物百科知识'
# 重复次数
n = 10000

data = [
    {
   
   
        "conversation": [
            {
   
   
                "input": "请做一下自我介绍",
                "output": "我是{}小助手，内在是上海AI实验室书生·浦语的1.8B大模型哦".format