2025 最新 DeepSeek-R1-Distill-Qwen-14B vLLM 部署全攻略:从环境搭建到性能测试(V100-32GB * 2)

AI 时代程序员必备技能

Codex、Claude Code、Cursor、Hermes Agent、OpenClaw等工程化实战专栏 ,讲透 AI 如何接管脏活累活

环境准备

本文基础环境如下:

----------------
x86_64
ubuntu 22.04 or centos 7
gpu: V100(32GB) * 2
python 3.12
cuda 12.2
pytorch 2.5.1
----------------

本文默认已配置好以上 Pytorch (cuda)​ 环境,如未配置请先自行安装。

依赖安装

  • 新建虚拟环境

    • ​-n DeepSeekR1​:指定要创建的虚拟环境的名称为 DeepSeekR1​。
    • ​python=3.12:指定虚拟环境中 Python 的版本为 3.12。
    • ​-y​:在创建环境过程中自动确认所有提示,无需手动输入 yes​。
    • ​-c​:用于指定 conda​ 源。这里指定了清华大学的主源和自由源。
    • ​--override-channels​ 临时禁用默认源,仅使用你指定的源
conda create -n DeepSeekR1 python=3.12 -y \
--override-channels \
-c https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main \
-c https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free
  • 激活环境

    创建完成后,你可以使用以下命令来激活并验证虚拟环境:

    # 激活虚拟环境
    conda activate DeepSeekR1
    
    # 查看 Python 版本
    python --version
    

    如果输出的 Python 版本为 3.12,则说明虚拟环境创建成功。

  • 首先 pip​ 换源加速下载并安装依赖包

    pip config set global.index-url https://mirrors.aliyun.com/pypi/simple/
    pip install --upgrade pip 
    
  • 安装所需模块

    直接复制,快速安装

    也可以分开一个一个安

    pip install modelscope==1.22.3
    pip install openai==1.61.0
    pip install tqdm==4.67.1
    pip install transformers==4.48.2
    pip install vllm==0.7.1
    
  • 安装 pytorch

nvidia-smi 确认 cuda 版本需要大于等于pytorch安装的对应版本

pip install torch==2.5.1 torchvision==0.20.1 torchaudio==2.5.1 --index-url https://download.pytorch.org/whl/cu121

pytorch 下载太慢解决 见下文

检查安装是否成功

python -c "import torch; print(torch.cuda.is_available())"

输出True 这说明 GPU版本的pytorch​安装成功

模型下载

使用 modelscope 中的 snapshot_download 函数下载模型,第一个参数为模型名称,参数 local_dir为模型的下载路径。

新建 model_download.py​ 文件并在其中输入以下内容,粘贴代码后记得保存文件。

from modelscope import snapshot_download

model_dir = snapshot_download('deepseek-ai/DeepSeek-R1-Distill-Qwen-14B', local_dir='deepseek-ai/DeepSeek-R1-Distill-Qwen-14B', revision='master')

然后在终端中输入 python model_download.py​ 执行下载,这里需要耐心等待一段时间直到模型下载完成。

注意:记得修改 local_dir​ 为你的模型下载路径

创建兼容 OpenAI API 接口的服务器

​DeepSeek-R1-Distill-Qwen​ 兼容 OpenAI API​ 协议,所以我们可以直接使用 vLLM​ 创建 OpenAI API​ 服务器。vLLM​ 部署实现 OpenAI API​ 协议的服务器非常方便。默认会在 http://localhost:10040 启动

AI 时代程序员必备技能

Codex、Claude Code、Cursor、Hermes Agent、OpenClaw等工程化实战专栏 ,讲透 AI 如何接管脏活累活

评论 8
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

歌刎

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值