从零开始：DeepSeek与Dify私有化部署实战指南

最新推荐文章于 2026-04-08 10:17:30 发布

原创

最新推荐文章于 2026-04-08 10:17:30 发布 · 631 阅读

标签

#私有化部署 #DeepSeek #Dify #Ollama

AI 时代程序员必备技能

Codex、Claude Code、Cursor、Hermes Agent、OpenClaw等工程化实战专栏，讲透 AI 如何接管脏活累活

一键订阅

1. 环境准备：你的AI服务器“地基”怎么打？

想自己在家或者公司里搭一个完全听你指挥的AI大脑吗？听起来很酷，但第一步千万别急着下载模型。我见过太多朋友兴冲冲地开始，结果卡在环境配置上，折腾半天又得重来。今天我就用我这几年踩过的坑，给你捋一个最稳、最省事的开局。

首先，咱们得搞清楚，你要搭的这个“AI系统”其实分两大块：一个是DeepSeek模型，它是真正的“大脑”，负责思考和生成内容；另一个是Dify平台，它相当于一个“智能中控室”，让你能通过网页、API等方式方便地使用这个大脑，还能给它喂你自己的知识文档。所以，我们的准备工作也得围绕这两部分来。

硬件这块，别被“专业级”吓到。 很多人一听说大模型，就觉得非得搞个几万块的服务器。其实不然。对于想尝鲜、做原型验证或者个人学习，你的游戏电脑可能就够用。核心是看你想跑多大的模型。DeepSeek有不同尺寸的版本，比如7B（70亿参数）、14B等。参数越大，模型越聪明，但胃口也越大。

CPU：现在的电脑CPU基本都支持AVX2指令集，这是跑这些模型的基础。Intel i5十代以上或者AMD Ryzen 5系列就够用，当然i7或R7更好。
内存：这是最容易成为瓶颈的地方。我建议起步就16GB。如果你想跑7B模型，并且同时运行Dify和一些其他服务，16GB是舒适线。8GB会很勉强，系统可能会频繁使用硬盘交换空间，导致卡成幻灯片。预算允许，直接上32GB，会从容很多。
显卡（GPU）：这是加速推理的“涡轮增压器”。有独立显卡，特别是NVIDIA的显卡，体验会好很多。RTX 3060 12GB 是个甜点卡，跑7B模型非常流畅。如果没有显卡，或者用的是Mac（M系列芯片）也没关系，模型可以完全用CPU来跑，就是速度会慢一些。我实测过，在苹果M2 Max的电脑上用CPU跑7B模型，日常对话的响应速度也是可以接受的。
存储：准备至少50GB的剩余空间。模型文件本身很大（一个7B模型大概14GB），你还需要空间存放Dify、数据库以及你自己的知识库文档。强烈建议别把模型放在系统C盘，单独用一个空间充裕的盘。

软件环境是另一个重头戏。 为了省去各种依赖库的麻烦，我们主要靠两个神器：Docker和Ollama。

Docker：你可以把它理解成一个“标准化集装箱”。Dify平台以及它需要的数据库、缓存等所有服务，都会被打包成一个个的Docker容器。我们只需要一条命令就能把它们全部启动起来，完全不用操心“在我电脑上能运行，到你那就报错”的问题。无论是Windows、Mac还是Linux，先去Docker官网下载安装Desktop版本就行。
Ollama：你可以把它看作一个“模型管理器”。它专门用来下载、管理和运行各种开源大模型，DeepSeek就是其中之一。它的好处是命令极其简单，比如ollama run deepseek-r1:7b就能直接和模型对话，省去了我们手动配置Python环境、安装PyTorch等一堆复杂操作。

在开始安装它们之前，有个小技巧：如果你在国内，最好先给Docker配置一下镜像加速器，否则从国外拉取镜像可能会慢到让你怀疑人生。这里以Linux系统为例，你可以在终端里执行下面这个命令（Windows和Mac可以在Docker Desktop的设置界面里直接添加镜像地址）：

# 创建或修改Docker的配置文件
sudo tee /etc/docker/daemon.json <<-'EOF'
{
  "registry-mirrors": [
    "https://docker.1panel.dev",
    "https://dockerpull.cn"
  ]
}
EOF
# 重启Docker服务让配置生效
sudo

AI 时代程序员必备技能

Codex、Claude Code、Cursor、Hermes Agent、OpenClaw等工程化实战专栏，讲透 AI 如何接管脏活累活

一键订阅