1. 环境准备:你的AI服务器“地基”怎么打?
想自己在家或者公司里搭一个完全听你指挥的AI大脑吗?听起来很酷,但第一步千万别急着下载模型。我见过太多朋友兴冲冲地开始,结果卡在环境配置上,折腾半天又得重来。今天我就用我这几年踩过的坑,给你捋一个最稳、最省事的开局。
首先,咱们得搞清楚,你要搭的这个“AI系统”其实分两大块:一个是DeepSeek模型,它是真正的“大脑”,负责思考和生成内容;另一个是Dify平台,它相当于一个“智能中控室”,让你能通过网页、API等方式方便地使用这个大脑,还能给它喂你自己的知识文档。所以,我们的准备工作也得围绕这两部分来。
硬件这块,别被“专业级”吓到。 很多人一听说大模型,就觉得非得搞个几万块的服务器。其实不然。对于想尝鲜、做原型验证或者个人学习,你的游戏电脑可能就够用。核心是看你想跑多大的模型。DeepSeek有不同尺寸的版本,比如7B(70亿参数)、14B等。参数越大,模型越聪明,但胃口也越大。
- CPU:现在的电脑CPU基本都支持AVX2指令集,这是跑这些模型的基础。Intel i5十代以上或者AMD Ryzen 5系列就够用,当然i7或R7更好。
- 内存:这是最容易成为瓶颈的地方。我建议起步就16GB。如果你想跑7B模型,并且同时运行Dify和一些其他服务,16GB是舒适线。8GB会很勉强,系统可能会频繁使用硬盘交换空间,导致卡成幻灯片。预算允许,直接上32GB,会从容很多。
- 显卡(GPU):这是加速推理的“涡轮增压器”。有独立显卡,特别是NVIDIA的显卡,体验会好很多。RTX 3060 12GB 是个甜点卡,跑7B模型非常流畅。如果没有显卡,或者用的是Mac(M系列芯片)也没关系,模型可以完全用CPU来跑,就是速度会慢一些。我实测过,在苹果M2 Max的电脑上用CPU跑7B模型,日常对话的响应速度也是可以接受的。
- 存储:准备至少50GB的剩余空间。模型文件本身很大(一个7B模型大概14GB),你还需要空间存放Dify、数据库以及你自己的知识库文档。强烈建议别把模型放在系统C盘,单独用一个空间充裕的盘。
软件环境是另一个重头戏。 为了省去各种依赖库的麻烦,我们主要靠两个神器:Docker和Ollama。
- Docker:你可以把它理解成一个“标准化集装箱”。Dify平台以及它需要的数据库、缓存等所有服务,都会被打包成一个个的Docker容器。我们只需要一条命令就能把它们全部启动起来,完全不用操心“在我电脑上能运行,到你那就报错”的问题。无论是Windows、Mac还是Linux,先去Docker官网下载安装Desktop版本就行。
- Ollama:你可以把它看作一个“模型管理器”。它专门用来下载、管理和运行各种开源大模型,DeepSeek就是其中之一。它的好处是命令极其简单,比如
ollama run deepseek-r1:7b就能直接和模型对话,省去了我们手动配置Python环境、安装PyTorch等一堆复杂操作。
在开始安装它们之前,有个小技巧:如果你在国内,最好先给Docker配置一下镜像加速器,否则从国外拉取镜像可能会慢到让你怀疑人生。这里以Linux系统为例,你可以在终端里执行下面这个命令(Windows和Mac可以在Docker Desktop的设置界面里直接添加镜像地址):
# 创建或修改Docker的配置文件
sudo tee /etc/docker/daemon.json <<-'EOF'
{
"registry-mirrors": [
"https://docker.1panel.dev",
"https://dockerpull.cn"
]
}
EOF
# 重启Docker服务让配置生效
sudo


2394

被折叠的 条评论
为什么被折叠?



