书生浦语第二期实战营学习笔记(作业)(第四节课)

本文详细介绍了书生浦语第二期实战营中的技术内容,包括Finetune的基础概念、XTuner的使用方法、模型微调步骤、多模态微调实战以及如何将模型上传到OpenXLab并部署。涵盖了Finetune的不同范式、工具及命令行操作,以及在实际项目中的应用案例。

书生浦语第二期实战营系列—综述加技术报告研读
书生浦语第二期实战营系列—Tutorial1:demo体验
书生浦语第二期实战营系列—Tutorial2:RAG
书生浦语第二期实战营系列—Tutorial3:Xtuner微调
书生浦语第二期实战营系列—Tutorial4:Lmdeploy量化部署
书生浦语第二期实战营系列—Tutorial5:Agent
书生浦语第二期实战营系列—Tutorial6:OpenCompass

1 Finetune和xtuner简介

1.1 Finetune基础

1.1.1 Finetune的两种范式

根据微调的目的,主要分为两种
1.增量预训练微调
2.指令跟随微调
请添加图片描述

1.1.2 Finetune的三种方式

1.全量微调
2.Lora
3.Qlora
请添加图片描述

1.1.3 Finetune的数据格式

请添加图片描述

1.2 Finetune工具XTuner

1.2.1 XTuner简介

请添加图片描述

1.2.2 XTuner加速手段

1.多数据拼接
请添加图片描述
2.使用Flash Attention和DeepSpeed
请添加图片描述

1.2.3 XTuner常用命令

请添加图片描述

1.2.4 XTuner数据处理

请添加图片描述

2 微调模型

2.1 拉取代码

# 拉取 0.1.17 的版本源码
git clone -b v0.1.17  https://github.com/InternLM/xtuner

# 进入源码目录
cd xtuner

# 从源码安装 XTuner
pip install -e '.[all]'

#准备数据
使用tutorial中的示例

[
    {
   
   
        "conversation": [
            {
   
   
                "input": "请介绍一下你自己",
                "output": "我是{}的小助手,内在是上海AI实验室书生·浦语的1.8B大模型哦"
            }
        ]
    }
]

脚本

import json

# 输入你的名字
name = '您的宠物百科知识'
# 重复次数
n = 10000

data = [
    {
   
   
        "conversation": [
            {
   
   
                "input": "请做一下自我介绍",
                "output": "我是{}小助手,内在是上海AI实验室书生·浦语的1.8B大模型哦".format
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值