windows服务器本地部署deepseek并训练

原创已于 2025-02-22 17:59:12 修改 · 876 阅读

12 ·

本内容遵循CC 4.0 BY-SA版权协议

标签

#windows

于 2025-02-22 13:31:38 首次发布

AI 时代程序员必备技能

Codex、Claude Code、Cursor、Hermes Agent、OpenClaw等工程化实战专栏，讲透 AI 如何接管脏活累活

一键订阅

1.安装python3.10

下载地址 Index of python-local/3.10.9

安装64位windows版本

2.下载到LLaMA-Factory

github地址：

GitHub - hiyouga/LLaMA-Factory: Unified Efficient Fine-Tuning of 100+ LLMs & VLMs (ACL 2024)

3. 修改pip镜像源

-- 将pip使用镜像源更新为最新版
python -m pip install -i https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple --upgrade pip

-- 修改pip镜像源
pip config set global.index-url https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple

参考：

pip 使用国内镜像源 | 菜鸟教程

4.安装LLama-Factory及所需依赖

进入第二步下载的LLaMA-Factory-main 文件夹，输入

pip install -e".[torch,metrics]"

会报错：

 The Meson build system
      Version: 1.2.1
      Source dir: C:\Users\admin\AppData\Local\Temp\pip-install-6ydmaptf\pandas_5de9343fe55647d897afde828b9c3cd9
      Build dir: C:\Users\admin\AppData\Local\Temp\pip-install-6ydmaptf\pandas_5de9343fe55647d897afde828b9c3cd9\.mesonpy-_m3_eubb\build
      Build type: native build
      Project name: pandas
      Project version: 2.2.3

      ..\..\meson.build:2:0: ERROR: Could not find C:\Program Files (x86)\Microsoft Visual Studio\Installer\vswhere.exe

      A full log can be found at C:\Users\admin\AppData\Local\Temp\pip-install-6ydmaptf\pandas_5de9343fe55647d897afde828b9c3cd9\.mesonpy-_m3_eubb\build\meson-logs\meson-log.txt
      [end of output]

把报错信息复制给deepseek，说需要安装visualstudio

按照deepseek的步骤安装visual studio后，问题解决

5. 检查llama-Factory是否安装完成

llamafactory-cli version

有响应，即安装成功

6.下载LLama-Factory版本的deepseek

cmd 输入python 进入python环境

from modelscope import snapshot_download

# 指定下载后的路径，你可以根据实际情况修改这个路径
custom_cache_dir = "D:/your_custom_model_path"  

model_dir = snapshot_download("deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B", revision="master", cache_dir=custom_cache_dir)
print(f"模型已下载到: {model_dir}")

7.启动LLama-Factory的web界面

在第二步的LLama-Factory文件夹，打开命令行输入如下内容

--model-path 是第六步下载的模型地址

set TRANSFORMERS_OFFLINE=1
llamafactory-cli webui --model-path "C:\Users\admin\.cache\modelscope\hub\models\deepseek-ai\DeepSeek-R1-Distill-Qwen-1___5B"