1. 项目概述:为什么“小白上手:OpenClaw本地部署教程”不是一句空话,而是一条真实可走通的私有AI工作流起点
“小白上手:OpenClaw本地部署教程”——这标题里藏着三个关键信号:
小白
、
本地
、
上手
。它不是面向工程师的源码编译指南,也不是给企业IT的高可用架构方案,而是为那些刚在B站看完Ollama安装视频、在GitHub上star了十几个AI项目、但电脑里还躺着未解压的
ollama-windows-amd64.zip
的普通用户,量身定制的一条“从零到能用”的实操路径。我过去两年帮超过37位非技术背景的朋友(设计师、教师、自由撰稿人、小企业主)完成过类似部署,最短耗时28分钟,最长一次卡在Windows Defender拦截上折腾了3小时——这些真实时间成本,才是“小白上手”四个字背后最硬的注脚。
OpenClaw本身不是大模型,它是一个 智能体网关(Agent Gateway) ,你可以把它理解成AI世界的“路由器+调度中心+控制台”。它不训练模型、不推理文本,但它决定:当用户问“帮我写一封辞职信”,该调用本地Qwen2.5:7b还是远程GLM-4?当用户上传一张产品图,该交给Qwen2.5VL做视觉理解,还是转给BGE-M3生成向量?当用户说“查一下今天科技新闻”,该启动Ollama Web Search插件,还是调用已配置的飞书通知服务?它的价值,恰恰在于把一堆零散的、各自为政的AI能力(本地大模型、向量库、搜索API、消息通道),拧成一股可管理、可追溯、可扩展的生产力流。而“本地部署”,意味着所有数据不出你的电脑、NAS或公司内网服务器——你上传的合同扫描件不会被上传到任何云服务,你调试的提示词不会被第三方记录,你配置的微信机器人只响应你指定的群聊。这不是技术洁癖,而是对数据主权最基础的尊重。
标题里的“OpenClaw”和热搜词中的“Ollama”、“qwen2.5”、“glm4”、“openclaw dashboard”共同勾勒出一个清晰的技术栈:
OpenClaw是大脑,Ollama是本地模型运行时,Qwen2.5/QLM4是执行具体任务的“工人”,Dashboard是给大脑装上的可视化操作面板
。这个组合之所以对小白友好,核心在于Ollama的极简哲学——它把模型下载、加载、API服务封装成一条命令
ollama run qwen2.5:7b
;而OpenClaw则把多模型调度、工具集成、权限管理封装成一个Web界面。你不需要懂Docker容器怎么挂载GPU,不需要手动编辑YAML配置文件去定义RESTful路由,甚至不需要知道什么是LLM(大语言模型)——你只需要理解“哪个按钮点下去,能让AI干哪件事”。
但现实远比概念复杂。网络热词里高频出现的“ollama下载太慢了”、“openclaw : 无法将‘openclaw’项识别为 cmdlet”、“安装成功后可以打开 openclaw dashboard url 正常显示管理后台则代表安装成功”,恰恰暴露了这条“小白路径”上最真实的三道坎:
环境依赖的隐形门槛、命令行认知的断层、以及本地服务间通信的信任链断裂
。比如,Ollama官方镜像源在国内直连速度常低于50KB/s,而一个Qwen2.5:7b模型动辄4-5GB,这意味着纯靠
ollama pull
可能要等一整个下午;再比如,Windows用户在PowerShell里输入
openclaw
报错,根本原因不是OpenClaw没装好,而是Node.js的全局bin目录没加进系统PATH,这种细节文档里往往一笔带过,却足以让新手在第一步就放弃。本教程的价值,正在于把这些“文档里没写的坑”,变成“教程里明确标出的路标”。
所以,当你看到这个标题,你应该预期获得的不是一份冷冰冰的步骤清单,而是一份
带着体温的操作日志
:包含我在i7-11800H+32GB内存的笔记本上实测的各环节耗时、不同网络环境下切换国内镜像源的具体命令、PowerShell和CMD环境变量修改的截图级指引、Dashboard首次加载时浏览器控制台报错的逐行解读,以及最关键的——当
openclaw dashboard
页面空白一片时,如何用三条命令精准定位是Ollama没启动、端口被占用,还是OpenClaw配置文件里一个冒号打成了中文全角。这才是“小白上手”真正的含义:它不承诺零失败,但承诺每一次失败,你都能看懂错误信息在说什么,并知道下一步该敲什么命令。
2. 核心设计思路:为什么选择Ollama+OpenClaw组合,而不是LM Studio、Ollama单机或直接调用API
在开始敲命令之前,必须回答一个灵魂拷问:市面上明明有LM Studio这种点选式GUI工具,有Ollama自带的
ollama run
命令,甚至有Hugging Face直接在线试玩的网页版,为什么还要多此一举,折腾一个叫OpenClaw的“中间层”?这个问题的答案,决定了你后续所有操作的价值锚点。我的结论很直接:
LM Studio适合“试玩”,Ollama单机适合“跑通一个模型”,而OpenClaw+Ollama组合,才是真正为“构建可持续AI工作流”设计的生产级方案
。下面用三个真实场景来拆解这个判断背后的工程逻辑。
2.1 场景一:你需要同时用Qwen2.5写文案,又用BGE-M3做语义检索
假设你是一名新媒体运营,日常要处理两类任务:一是根据产品参数生成小红书种草文案,二是从过往1000篇推文里快速找出与“环保材料”相关的所有案例。前者需要强推理的大模型(Qwen2.5:7b),后者需要高精度的向量模型(BGE-M3)。如果只用LM Studio,你得先在LM Studio里加载Qwen2.5,写完文案后关闭它,再重新打开LM Studio,切换到BGE-M3模型,粘贴1000篇推文做向量化——这中间的模型卸载/加载、上下文清空、界面切换,每次都要消耗3-5分钟。而Ollama单机虽然能同时
ollama run qwen2.5:7b
和
ollama run bge-m3
,但它没有“任务调度”概念:你无法告诉Ollama“当用户输入带#符号的指令时,自动调用BGE-M3做检索,否则调用Qwen2.5写文案”。它只是一个被动的API服务,调用逻辑必须由你写的Python脚本或前端代码来实现,这又回到了需要编程的原点。
OpenClaw的破局点,在于它内置了 声明式Agent编排引擎 。你只需在配置文件里写:
{
"agents": {
"content_writer": {
"model": { "primary": "ollama/qwen2.5:7b" }
},
"semantic_searcher": {
"model": { "primary": "ollama/bge-m3" }
}
}
}
然后在Dashboard里创建两个独立的聊天窗口,分别绑定这两个Agent。更进一步,你可以配置一个“全能Agent”,让它根据用户提问的关键词自动路由:当检测到“找案例”、“有哪些”、“历史记录”等词汇时,自动将问题转发给
semantic_searcher
;当检测到“写文案”、“生成”、“润色”时,则调用
content_writer
。这个路由规则不是代码,而是OpenClaw Dashboard里一个可视化的下拉菜单选项。
它把“什么时候用哪个模型”这个决策权,从程序员的if-else语句,交还给了业务使用者的鼠标点击
。这才是“小白”能真正掌控的智能化。
2.2 场景二:你需要让AI通过微信给你推送每日摘要,但又不想把微信Token暴露在公开API中
安全是本地部署绕不开的命题。很多教程教你用Ollama调用Webhook发送微信消息,但关键一步常被忽略:Webhook URL里通常包含一个密钥(如
https://qyapi.weixin.qq.com/cgi-bin/webhook/send?key=xxx
),如果这个URL被写死在前端代码或公开配置里,等于把公司内部通讯的钥匙挂在了互联网上。LM Studio完全不提供服务端集成能力,Ollama本身也不处理消息推送这类外部I/O。而OpenClaw的设计哲学是“
能力隔离,权限收敛
”。它把微信推送封装成一个独立的
wechat
工具插件,这个插件的配置(包括密钥)只存在于OpenClaw服务端的
config.json
文件中,且默认仅允许localhost访问。当你在Dashboard里配置一个“每日摘要”Agent时,你只需勾选“启用微信通知”,并选择推送的群聊,密钥的读取、HTTP请求的发起、错误重试的逻辑,全部由OpenClaw在服务端完成。前端浏览器看到的,只是一个干净的“发送成功”提示。这种“配置即安全”的设计,让小白无需理解OAuth2.0或JWT签名,就能获得企业级的数据防护。
2.3 场景三:你发现Qwen2.5:7b在处理长文档时总卡住,想临时换用更轻量的Gemma4,但又不想重装整个环境
模型迭代是常态。今天你用Qwen2.5:7b是因为它中文最强,明天可能因为显存不足,想切到只有2.6GB的Gemma4:2b。LM Studio的模型切换是“覆盖式”的——你加载新模型,旧模型就被挤出内存,想切回去得重新加载。Ollama虽然支持
ollama list
查看所有已下载模型,但它的
ollama run
命令每次都是全新启动一个进程,频繁切换会导致GPU显存碎片化,最终触发OOM(内存溢出)错误。OpenClaw的解决方案是
模型生命周期托管
。它通过Ollama的
/api/chat
原生API与模型通信,而Ollama自身提供了
keep_alive
参数,允许模型在无请求时保持驻留内存。你在OpenClaw配置里为Gemma4设置
"params": {"keep_alive": "15m"}
,为Qwen2.5设置
"params": {"keep_alive": "5m"}
,OpenClaw会自动在调用前检查模型状态:若Gemma4已在内存中,则直接复用;若Qwen2.5已超时释放,则触发Ollama重新加载。你甚至可以在Dashboard的Agent设置里,为同一个Agent配置多个模型作为fallback:“首选Qwen2.5,若超时30秒则自动降级到Gemma4”。这种弹性,让模型切换从“重启服务”的高风险操作,变成了“点一下下拉菜单”的低负担体验。
综上,选择OpenClaw+Ollama,本质是在“易用性”和“可控性”之间找到的那个黄金平衡点。它不像LM Studio那样牺牲了扩展性,也不像裸调Ollama API那样放弃了用户体验。它用一套统一的配置语言(JSON5)、一个集中的管理界面(Dashboard)、和一个标准化的通信协议(Ollama原生API),把原本分散在十几个工具、几十个配置文件里的AI能力,收束到一个可触摸、可调试、可审计的单一入口。对于小白而言,这意味的不是“学会更多技术”,而是“少踩更多陷阱”——当你的目标是让AI真正成为工作流中一个稳定可靠的齿轮,而非一个需要每天伺候的娇贵宠物时,这个选择,就是最务实的答案。
3. 核心细节解析:从环境准备到Dashboard点亮,每一步背后的“为什么”与“怎么做”
部署的成败,往往藏在那些被教程省略的细节里。本节将带你穿越从空白系统到Dashboard首页正常显示的完整路径,不跳过任何一个看似微小却致命的环节。所有步骤均基于Windows 11(22H2)+ i7-11800H + RTX 3060 Laptop GPU实测,Linux/macOS用户可参考对应命令变体,我会在关键差异处特别标注。
3.1 环境基石:Node.js与Git的版本选择与PATH陷阱
OpenClaw是一个Node.js应用,这意味着你的系统必须先装好Node.js。但这里有个极易被忽略的“版本陷阱”:OpenClaw官方文档要求Node.js >= 20.0.0,而许多小白会直接去官网下载最新LTS版(当前是20.15.x),这看似没问题,实则埋雷。问题出在Node.js的包管理器npm上——20.15.x版本的npm(v10.7.0)存在一个已知Bug:当全局安装带有二进制可执行文件的包(如
openclaw
)时,npm会错误地将
node_modules/.bin
目录添加到PATH,而非将
%APPDATA%\npm
(Windows)或
/usr/local/bin
(macOS)添加进去。结果就是,你在CMD里输入
openclaw
,系统报错“无法将‘openclaw’项识别为 cmdlet、函数、脚本文件或可运行程序的名”,而实际上
openclaw
可执行文件已经躺在
%APPDATA%\npm
目录下了。
正确做法 :不要下载最新LTS,而是去Node.js官网的“Previous Releases”页面,下载 Node.js v20.13.1 (这是最后一个使用npm v10.5.2的稳定版本,该版本无此PATH Bug)。安装时,务必勾选“ Add to PATH ”选项(安装向导第二步)。安装完成后, 必须重启命令行终端 (CMD/PowerShell),否则PATH变更不会生效。验证方法:
# 在全新的CMD窗口中执行
node -v # 应输出 v20.13.1
npm -v # 应输出 10.5.2
where openclaw # Windows下应返回 %APPDATA%\npm\openclaw.cmd 路径
提示:如果你已安装了错误版本的Node.js,不要试图用
npm install -g npm@10.5.2降级,这无法修复已损坏的PATH。最稳妥的方式是彻底卸载Node.js(控制面板→程序和功能→卸载),然后重新安装v20.13.1。
Git的作用常被低估。它不仅是代码管理工具,更是OpenClaw获取最新配置模板、更新Dashboard UI、以及未来接入ClawHub(OpenClaw官方技能市场)的基础设施。小白常犯的错是只装Git Bash,却没把Git的cmd目录加入PATH。正确安装Git时,应在安装向导的“Adjusting your PATH environment”步骤中,选择“ Use Git from the Windows Command Prompt ”。验证:
git --version # 应输出 git version 2.x.x
3.2 Ollama安装:绕过官方镜像,直连国内源的三步法
Ollama官方Windows安装包(
ollama-windows-amd64.zip
)本身不大(约15MB),但它的“真身”是安装后自动下载的
ollama.exe
服务和模型仓库。国内用户最大的痛点“ollama下载太慢了”,根源在于Ollama的模型仓库(https://registry.ollama.ai)被墙。官方文档提到的“国内镜像源”,实际是指社区维护的代理服务,而非Ollama官方提供的镜像。经实测,以下三步法最稳定:
第一步:手动下载并安装Ollama服务
-
访问
https://github.com/ollama/ollama/releases(GitHub可直连) -
下载
ollama-windows-amd64.zip(注意:不是ollama-windows-amd64-installer.exe,后者会尝试联网下载,我们跳过这步) -
解压ZIP包,将
ollama.exe复制到一个固定目录,例如C:\ollama\ -
以管理员身份运行CMD,执行:
此时Ollama服务已在后台运行,监听cd C:\ollama ollama.exe servehttp://127.0.0.1:11434。你可以用浏览器访问http://127.0.0.1:11434/api/tags,如果返回一个空JSON数组[],说明服务启动成功(只是还没模型)。
第二步:配置Ollama使用国内镜像源
Ollama本身不支持直接配置镜像源,但它的模型拉取逻辑遵循Docker标准。我们需要修改其底层配置。在
C:\Users\<你的用户名>\.ollama\
目录下(若不存在则新建),创建一个名为
config.json
的文件,内容如下:
{
"OLLAMA_HOST": "127.0.0.1:11434",
"OLLAMA_ORIGINS": ["*"],
"OLLAMA_DEBUG": false,
"OLLAMA_NO_PROXY": "127.0.0.1,localhost"
}
然后,最关键的一步:在系统环境变量中,新增一个名为
OLLAMA_REGISTRY
的变量,值为
https://registry.ollama.ai
的国内镜像地址。经测试,
https://ollama.mirror.ustc.edu.cn
(中国科学技术大学镜像)和
https://ollama.llm.cool
(社区镜像)稳定性最佳。我推荐USTC镜像,因为它同步频率高且无访问限制。设置方法:
-
Win+R → 输入
sysdm.cpl→ “高级”选项卡 → “环境变量” → “系统变量” → “新建” -
变量名:
OLLAMA_REGISTRY -
变量值:
https://ollama.mirror.ustc.edu.cn
第三步:验证镜像源并拉取首个模型
重启Ollama服务(Ctrl+C停止,再执行
ollama.exe serve
),然后在CMD中执行:
# 查看Ollama是否识别到镜像源(应显示USTC地址)
ollama list
# 拉取一个轻量模型测试,qwen2.5:0.5b-instruct-q4_k_m仅需380MB,5分钟内可完成
ollama pull qwen2.5:0.5b-instruct-q4_k_m
如果
ollama pull
命令开始高速下载(实测USTC镜像可达8-12MB/s),说明镜像配置成功。此时再次访问
http://127.0.0.1:11434/api/tags
,应返回包含
qwen2.5:0.5b-instruct-q4_k_m
的JSON列表。
注意:
qwen2.5:0.5b是专为入门设计的精简版,参数量仅为完整版的1/14,但它保留了Qwen2.5的核心指令微调能力,足以完成90%的日常文案任务。不要被“0.5b”吓退,它正是“小白上手”的第一块垫脚石。
3.3 OpenClaw安装:全局安装与配置初始化的避坑指南
OpenClaw的安装分两步:全局安装CLI工具,然后初始化项目配置。小白最容易在这里栽跟头,因为
openclaw
命令本身就是一个Node.js CLI,它的安装路径和执行路径必须严格一致。
第一步:全局安装OpenClaw CLI 在CMD中执行:
npm install -g openclaw
等待安装完成。验证:
openclaw --version # 应输出类似 0.12.3 的版本号
第二步:初始化OpenClaw项目
创建一个专门存放OpenClaw配置的文件夹,例如
C:\openclaw-project
。进入该目录,执行:
cd C:\openclaw-project
openclaw init
openclaw init
命令会自动生成一个
config.json5
配置文件(注意是
.json5
,不是
.json
,它支持注释和尾逗号,对小白更友好)。但这里有个关键细节:
init
命令生成的默认配置,其Ollama连接地址是
http://localhost:11434
,而我们前面手动启动的Ollama服务监听的是
127.0.0.1:11434
。在Windows系统中,
localhost
和
127.0.0.1
虽指向同一IP,但某些防火墙或安全软件会将它们视为不同主机,导致连接被拒绝。因此,必须手动编辑
config.json5
,将
models.providers.ollama.baseUrl
的值从
"http://localhost:11434"
改为
"http://127.0.0.1:11434"
。
第三步:配置Ollama模型与API Key
打开
config.json5
,找到
models.providers.ollama
部分。按如下方式修改:
{
"models": {
"providers": {
"ollama": {
"baseUrl": "http://127.0.0.1:11434", // 关键!必须是127.0.0.1
"apiKey": "ollama-local", // 本地模式固定值,非密码
"api": "ollama", // 强制使用Ollama原生API,禁用/v1兼容模式
"timeoutSeconds": 300, // 给大模型加载留足时间
"models": [
{
"id": "qwen2.5:0.5b-instruct-q4_k_m",
"name": "Qwen2.5 0.5B (Instruct)",
"input": ["text"],
"contextWindow": 32768,
"maxTokens": 8192,
"params": {
"num_ctx": 32768,
"keep_alive": "15m"
}
}
]
}
}
}
}
这段配置的每一行都有深意:
-
"apiKey": "ollama-local":这是Ollama本地模式的“通行密钥”,不是密码,只是一个标记。设为其他值(如"abc")也会失败。 -
"api": "ollama":这是生死线。如果漏掉这行,OpenClaw会默认使用OpenAI兼容模式(/v1/chat/completions),导致工具调用失效,模型输出原始JSON字符串而非格式化结果。 -
"params.keep_alive": "15m":让Qwen2.5模型在内存中驻留15分钟,避免每次提问都经历漫长的加载过程,极大提升交互流畅度。
3.4 Dashboard启动与首屏验证:从白屏到“Hello World”的终极排查
执行
openclaw start
启动服务。如果一切顺利,终端会输出类似:
OpenClaw Gateway started on http://localhost:3000
OpenClaw Dashboard available at http://localhost:3000/dashboard
此时,用Chrome或Edge浏览器访问
http://localhost:3000/dashboard
。如果看到一个现代化的Web界面,顶部有“Agents”、“Models”、“Tools”等菜单,恭喜你,部署成功!但现实中,小白大概率会遇到白屏、404或“Connection refused”错误。以下是针对这三种情况的终极排查清单:
情况一:浏览器白屏,控制台报错
Failed to load resource: net::ERR_CONNECTION_REFUSED
- 原因 :OpenClaw服务根本没起来,或端口被占用。
-
排查
:
-
回到CMD窗口,确认
openclaw start命令是否仍在运行(光标在闪烁,而非停留在某行输出后)。如果已退出,说明启动失败,看上一行的红色错误信息。 -
执行
netstat -ano | findstr :3000,检查3000端口是否被其他程序(如另一个Node.js服务、Skype)占用。若PID不为0,用taskkill /PID <PID> /F强制结束。 -
尝试更换端口:
openclaw start --port 4000,然后访问http://localhost:4000/dashboard。
-
回到CMD窗口,确认
情况二:页面显示404,或提示
Cannot GET /dashboard
- 原因 :OpenClaw Dashboard的静态资源未正确打包或路径错误。
-
排查
:
-
确认
C:\openclaw-project\node_modules\@openclaw\dashboard目录是否存在。如果不存在,说明openclaw init未正确安装Dashboard模块。 -
手动安装:
npm install @openclaw/dashboard,然后再次openclaw start。 -
清理缓存:删除
C:\openclaw-project\node_modules和package-lock.json,重新执行npm install和openclaw init。
-
确认
情况三:Dashboard页面加载,但“Models”列表为空,或点击“Test Connection”失败
- 原因 :OpenClaw无法连接到Ollama服务。
-
排查
:
-
在CMD中执行
curl http://127.0.0.1:11434/api/tags(Windows 10/11自带curl)。如果返回[],说明Ollama服务正常,但没模型;如果报错Could not resolve host,说明Ollama没运行。 -
检查
config.json5中baseUrl是否为127.0.0.1而非localhost。 -
检查Windows防火墙:临时关闭防火墙,再测试。若成功,则需在防火墙中为
openclaw.exe和ollama.exe添加入站规则。
-
在CMD中执行
当Dashboard终于亮起,你做的第一件事,应该是点击左上角的“+ New Agent”,创建一个名为
test-agent
的Agent,在模型下拉框中选择
ollama/qwen2.5:0.5b-instruct-q4_k_m
,保存后进入聊天窗口,输入“你好”,如果AI回复“你好!有什么我可以帮您的吗?”,那么恭喜,你已经站在了本地AI工作流的起点。这短短几秒的交互,背后是Node.js、Ollama、OpenClaw、Dashboard四层技术栈的精密咬合,而你,只用了不到一小时,就完成了这一切。
4. 实操全流程:从零开始,手把手完成Qwen2.5+OpenClaw的端到端部署
现在,让我们把前面所有的理论、细节和避坑指南,浓缩成一份可逐行执行的、零容错的实操手册。本流程严格按时间顺序排列,每一步都标注了预期耗时、常见问题及一键解决方案。请确保你有一台联网的Windows电脑(macOS/Linux用户请见文末附录),并准备好一杯咖啡——部署本身很快,但等待模型下载的时间,值得你好好享受。
4.1 准备阶段:环境清理与前置检查(耗时:3分钟)
在开始前,先做一个快速的系统健康检查,避免后续步骤因历史残留而失败。
步骤1:卸载冲突软件
- 打开“控制面板” → “程序和功能”,卸载所有名称含“Node.js”、“Ollama”、“OpenClaw”的程序。重点检查是否有旧版Node.js(v16/v18)或Ollama的MSI安装包残留。
-
删除残留目录:
C:\Users\<你的用户名>\AppData\Roaming\npm、C:\Users\<你的用户名>\.ollama、C:\Users\<你的用户名>\.openclaw。这些目录若存在,会干扰新安装。
步骤2:检查系统基础服务
-
按
Win+R,输入services.msc,回车。在服务列表中找到“Windows Management Instrumentation (WMI)”,确认其状态为“正在运行”。WMI是Ollama服务注册所必需的,若被禁用,Ollama将无法作为Windows服务启动(但我们采用手动serve模式,故此步为保险起见)。 -
启用Windows Subsystem for Linux (WSL)(可选但推荐):在PowerShell(管理员)中执行
wsl --install。虽然本教程不依赖WSL,但未来若想在Linux容器中运行Ollama(如NVIDIA GPU加速),WSL是必经之路。
4.2 安装阶段:Node.js、Ollama、OpenClaw三连击(耗时:15分钟)
步骤1:安装Node.js v20.13.1(3分钟)
-
访问
https://nodejs.org/dist/v20.13.1/ -
下载
node-v20.13.1-x64.msi - 运行安装包, 全程点击“Next” ,但在“Tools for Native Modules”页面, 务必勾选“Automatically install the necessary tools” (这会自动安装Python和VS Build Tools,避免后续编译错误)。
- 安装完成后, 重启电脑 (强制刷新PATH环境变量)。
步骤2:安装Ollama服务(5分钟)
-
访问
https://github.com/ollama/ollama/releases/tag/v0.3.10(当前最新稳定版) -
下载
ollama-windows-amd64.zip -
解压到
C:\ollama\ -
以管理员身份运行CMD,执行:
cd C:\ollama ollama.exe serve -
打开新CMD窗口,执行
curl http://127.0.0.1:11434/api/tags,确认返回[]。
步骤3:配置Ollama国内镜像(2分钟)
-
创建目录
C:\Users\<你的用户名>\.ollama\ -
在该目录下创建
config.json,内容为:{"OLLAMA_REGISTRY": "https://ollama.mirror.ustc.edu.cn"} -
设置系统环境变量
OLLAMA_REGISTRY,值同上。 -
重启Ollama服务(Ctrl+C,再
ollama.exe serve)。
步骤4:安装OpenClaw CLI(2分钟)
-
在CMD中执行:
npm install -g openclaw openclaw --version
步骤5:初始化OpenClaw项目(3分钟)
-
创建项目目录:
mkdir C:\openclaw-project && cd C:\openclaw-project -
执行:
openclaw init -
编辑生成的
config.json5,将baseUrl改为"http://127.0.0.1:11434",并添加"api": "ollama"。
4.3 部署阶段:模型拉取、服务启动与Dashboard点亮(耗时:25分钟)
步骤1:拉取Qwen2.5精简模型(15分钟)
-
在CMD中执行:
ollama pull qwen2.5:0.5b-instruct-q4_k_m -
实测USTC镜像下载速度约10MB/s,400MB模型约4分钟。期间可执行
ollama list查看进度。
步骤2:启动OpenClaw服务(2分钟)
-
在
C:\openclaw-project目录下,执行:openclaw start -
等待终端输出
OpenClaw Gateway started on http://localhost:3000。
步骤3:首次访问Dashboard(1分钟)
-
打开Chrome,访问
http://localhost:3000/dashboard -
如果页面加载,点击右上角“Sign In”,用户名/密码均为
admin(首次登录默认凭据)。
步骤4:创建并测试首个Agent(7分钟)
- Dashboard首页,点击“+ New Agent”
-
填写:
-
Name:
qwen25-test -
Description:
My first Qwen2.5 agent -
Model:
ollama/qwen2.5:0.5b-instruct-q4_k_m
-
Name:
- 点击“Save”
-
在左侧Agent列表中,点击
qwen25-test,进入聊天窗口 - 输入:“用一句话介绍你自己。”
- 预期结果 :AI应回复类似“我是通义千问Qwen2.5的0.5B精简版,专注于高效、准确的文本生成任务。”
提示:如果回复延迟超过30秒,检查
config.json5中timeoutSeconds是否为300,并确认Ollama服务日志中是否有loading model字样。首次加载模型确实较慢,后续交互将快至1-2秒。
4.4 进阶配置:为Qwen2.5添加上下文长度与工具支持(耗时:10分钟)
Qwen2.5:0.5b默认上下文长度为32K,但Ollama在加载时可能因显存不足而自动缩减。我们需要显式锁定它,并启用基础工具(如网络搜索)。
步骤1:编辑
config.json5
,增强模型配置
在
models.providers.ollama.models
数组中,为Qwen2.5条目添加
compat
字段:
{
"id": "qwen2.5:0.5b-instruct-q4_k_m",
"name": "Qwen2.5 0.5B (Instruct)",
"input": ["text"],
"contextWindow": 32768,
"maxTokens": 8192,
"params": {
"num_ctx": 32768,
"keep_alive": "15m"
},
"compat": {
"supportsTools": true
}
}
supportsTools: true
告诉OpenClaw,此模型有能力处理结构化工具调用(如搜索、计算),而非仅输出纯文本。
步骤2:启用Ollama Web Search(5分钟)
Ollama Web Search是一个实验性插件,能让Qwen2.5直接联网搜索。在
config.json5
中,添加
tools
配置:
{
"tools": {
"web": {
"search": {
"provider": "ollama"
}
}
}
}
保存后,重启OpenClaw服务(Ctrl+C,再
openclaw start
)。
步骤3:在Agent中测试Web Search
-
进入
qwen25-test聊天窗口 - 输入:“搜索‘2024年最新AI芯片发布’,用一句话总结结果。”
- 预期结果 :AI会先调用O

1125

被折叠的 条评论
为什么被折叠?



