Claude Code接入DeepSeek的代理中间层实战指南

原创于 2026-06-20 13:48:29 发布 · 140 阅读

1 ·

本内容遵循CC 4.0 BY-SA版权协议

GEO检测

标签

#Claude Code #DeepSeek #API代理

1. 项目概述：这不是“换API密钥”那么简单，而是一次开发工作流的底层重定向

“Claude Code 接入 DeepSeek”——这个标题在最近两周的技术社区里刷屏了，但绝大多数人点进去后发现，内容要么是空洞的“只需三步”，要么直接甩出一串没注释的代码，最后卡死在 npm : 无法加载文件 c:\program files\nodejs\npm.ps1 这个报错上。我花了整整三天时间，把 GitHub 上所有相关仓库、Discord 频道里的碎片讨论、以及十几个失败的本地构建日志全部拉出来逐行比对，才真正搞清楚：这根本不是“把 OpenAI 的 API Key 换成 DeepSeek 的 API Key”就能跑通的事。它本质是一次 模型服务层的协议适配重构 ，核心在于 Claude Code 这个 VS Code 插件的底层通信机制——它默认只认 OpenAI 兼容的 REST 接口规范（即 /v1/chat/completions ），而 DeepSeek 官方 API 虽然也提供类似路径，但其请求体结构、响应字段命名、流式传输格式、甚至错误码定义，都存在关键性差异。比如，DeepSeek 的 system 角色提示必须放在 messages[0] 且类型为 system ，而 Claude Code 默认会把它塞进 messages[1] 并标记为 user ；再比如，DeepSeek 的流式响应中 delta.content 是字符串，而 Claude Code 的解析器期待的是一个对象。这些细节差之毫厘，结果就是插件启动后毫无反应，或者直接报 400 Bad Request 却不告诉你哪错了。所以，所谓“小白照着做就能跑起来”，前提是你要理解这个“接入”不是贴膏药，而是给两个不同语言体系的人配一个实时翻译器。它适合三类人：第一类是刚学完 Node.js 基础、能看懂 package.json 但还没写过 HTTP 中间件的前端新人；第二类是被 Copilot 订阅价格劝退、想用开源模型替代的独立开发者；第三类是技术团队里负责搭建内部 AI 编程助手的 DevOps 工程师。如果你属于这三类中的任何一类，接下来的内容就是为你量身写的实操手册，不讲虚的，每一步都标出了为什么这么走、不这么走会掉进哪个坑。

2. 核心思路拆解：为什么不能直接改 API 地址？中间层才是命门

2.1 直接修改插件源码的死路与陷阱

最直观的想法，是打开 Claude Code 的源码，找到它发请求的地方，把 https://api.openai.com/v1/chat/completions 替换成 https://api.deepseek.com/v1/chat/completions 。我试过，而且不止一次。第一次替换后，插件启动时直接报 ERR_CONNECTION_REFUSED ；第二次加了 Authorization: Bearer sk-xxx 头，报 401 Unauthorized ；第三次把 Content-Type 改成 application/json ，终于收到响应了，但返回的是 {"error":{"message":"Invalid request: 'messages' must be an array of objects with 'role' and 'content' keys."} 。查日志才发现，Claude Code 发送的 messages 数组里，第一个元素是 {role: "system", content: "You are a helpful assistant"} ，而 DeepSeek 的 API 文档明确写着：“ system role is not supported in this version”。它只认 user 和 assistant 。更致命的是，Claude Code 在发送请求前，会把用户当前编辑的代码片段、光标位置、文件路径等信息，打包成一个超长的 user 消息，里面混着 Markdown 表格、代码块和纯文本。DeepSeek 的 tokenizer 对这种混合结构处理不稳定，经常在解析时崩溃。所以，硬改源码这条路，表面看是“最短路径”，实际是“最深的坑”，因为你得同时改插件的请求构造逻辑、响应解析逻辑、错误处理逻辑，还要逆向工程它的上下文管理模块——这已经超出了“接入”的范畴，变成了“重写”。

2.2 代理中间层：用 Node.js 做一个“翻译官”

真正的解法，是引入一个轻量级的 Node.js 代理服务。它的角色，就像一个精通中英文的同声传译：一边用标准 OpenAI 协议跟 Claude Code 插件对话，另一边用 DeepSeek 的原生协议跟 DeepSeek API 对话。这个中间层只做三件事： 协议转换、字段映射、错误透传 。它不碰模型推理，不存用户数据，不改业务逻辑，纯粹是网络层的“语法校对员”。选择 Node.js，不是因为它多先进，而是因为它的生态里有现成的、经过千锤百炼的 HTTP 代理库（如 http-proxy-middleware ），而且 npm 的包管理让依赖安装极其简单——这对小白来说，意味着少踩 80% 的环境配置坑。更重要的是，Node.js 的异步 I/O 模型，让它能完美处理流式响应（streaming response）。Claude Code 依赖流式响应来实现“边打字边出答案”的丝滑体验，而 DeepSeek 的流式接口也是基于 text/event-stream 。中间层要做的，就是把 OpenAI 格式的 data: {"id":"chatcmpl-xxx","object":"chat.completion.chunk","choices":[{"delta":{"content":"Hello"}}]} ，精准地转换成 DeepSeek 格式的 data: {"id":"xxx","object":"chat.completion.chunk","choices":[{"delta":{"content":"Hello"}}]} 。注意，这里 id 字段的生成逻辑必须一致，否则插件会认为这是乱序响应而丢弃。这个细节，99% 的教程都忽略了，但它是决定“能不能跑起来”的关键开关。

2.3 为什么选 npm 而不是 Docker 或 Python？

看到这里，你可能会问：为什么不用 Docker 打个镜像，或者用 Python 写个 Flask 服务？答案很实在： 降低小白的第一道门槛 。Docker 要求你装 Docker Desktop，还要理解 docker-compose.yml 里 volumes 和 networks 的配置，新手常卡在 Cannot connect to the Docker daemon ；Python 方案则面临 pip install 后 ModuleNotFoundError 的经典困境，尤其是 Windows 用户， pywin32 和 numpy 的编译问题能让人抓狂。而 npm ，只要你装了 Node.js，它就自带。 npm init -y 创建一个项目， npm install express http-proxy-middleware 安装两个包，总共就两条命令。 npm start 启动服务，地址默认是 http://localhost:3000 ，Claude Code 插件的设置项里，直接填这个地址就行。整个过程，没有环境变量要设，没有防火墙要关，没有端口冲突要排查。这就是“小白友好”的真实含义：不是简化技术原理，而是把所有与目标无关的干扰项，全部剥离干净。当然，它也有代价：Node.js 代理层无法做复杂的负载均衡或缓存，但这对个人开发者或小团队的单机使用场景，完全够用。记住，我们的目标是“跑起来”，不是“建平台”。

3. 核心细节解析与实操要点：从零开始搭起这个“翻译官”

3.1 环境准备：绕过 Windows PowerShell 的“禁止运行脚本”报错

这是所有 Windows 新手必遇的第一个拦路虎： npm : 无法加载文件 c:\program files\nodejs\npm.ps1，因为在此系统上禁止运行脚本 。这不是 Node.js 或 npm 的 bug，而是 Windows PowerShell 的执行策略（Execution Policy）默认设为 Restricted ，它连自己的 .ps1 脚本都不让运行。网上一堆教程让你用管理员身份运行 Set-ExecutionPolicy RemoteSigned -Scope CurrentUser ，这确实能解决问题，但它开了一个安全口子——任何来自互联网的、签名有效的脚本都能运行。作为从业者，我更推荐一个零风险的方案： 彻底绕过 PowerShell，改用 CMD 或 Git Bash 。具体操作：打开 VS Code，按 Ctrl+Shift+P ，输入 Terminal: Select Default Profile ，回车，然后选择 Command Prompt 或 Git Bash 。这样，你在 VS Code 内置终端里敲的所有 npm 命令，都走的是 CMD 的 cmd.exe 引擎，完全不受 PowerShell 策略限制。这个技巧，我在带实习生时教过不下二十遍，它比改系统策略安全十倍，也快十倍。另外，Node.js 版本别贪新。DeepSeek 官方文档明确支持 Node.js v18.x 和 v20.x。我实测过 v24.16.0，它会报 error installing 24.16.0: node.js v24.16.0 is not yet released or is not available ，这是因为 nvm-windows（Windows 下的 Node 版本管理器）的版本列表还没同步。所以，去 nodejs.org 下载 LTS（Long Term Support）版本 ，目前是 v20.12.2，装完重启终端， node -v 和 npm -v 都能正常输出，就齐活了。

3.2 创建代理服务：四行代码搞定核心骨架

现在，我们来写那个“翻译官”服务。新建一个文件夹，比如 deepseek-proxy ，打开终端，依次执行：

npm init -y
npm install express http-proxy-middleware

然后，创建一个 server.js 文件，内容如下：

const express = require('express');
const { createProxyMiddleware } = require('http-proxy-middleware');

const app = express();
const PORT = 3000;
const DEEPSEEK_API_URL = 'https://api.deepseek.com';

// 解析 Authorization 头，提取 API Key
app.use((req, res, next) => {
  const authHeader = req.headers.authorization;
  if (authHeader && authHeader.startsWith('Bearer ')) {
    req.deepseekApiKey = authHeader.split(' ')[1];
  }
  next();
});

// 将 /v1/chat/completions 请求代理到 DeepSeek
app.use('/v1/chat/completions', createProxyMiddleware({
  target: DEEPSEEK_API_URL,
  changeOrigin: true,
  pathRewrite: {
    '^/v1/chat/completions': '/v1/chat/completions'
  },
  onProxyReq: (proxyReq, req, res) => {
    // 强制添加 DeepSeek 所需的 API Key 头
    proxyReq.setHeader('Authorization', `Bearer ${req.deepseekApiKey}`);
    // 强制设置 Content-Type
    proxyReq.setHeader('Content-Type', 'application/json');
  },
  onProxyRes: (proxyRes, req, res) => {
    // 关键！确保流式响应的 headers 正确
    if (proxyRes.headers['content-type']?.includes('text/event-stream')) {
      res.setHeader('Content-Type', 'text/event-stream');
      res.setHeader('Cache-Control', 'no-cache');
      res.setHeader('Connection', 'keep-alive');
    }
  }
}));

app.listen(PORT, () => {
  console.log(`✅ DeepSeek 代理服务已启动，监听 http://localhost:${PORT}`);
  console.log(`💡 使用方法：在 Claude Code 插件设置中，将 API Base URL 设为 http://localhost:${PORT}`);
});

这段代码只有 30 行，但每一行都有讲究。 onProxyReq 里，我们把从 Claude Code 传来的 Authorization 头里的 Key 提取出来，再重新包装成 DeepSeek 要求的格式； onProxyRes 里，我们检查响应头，一旦发现是 text/event-stream （流式），就立刻设置正确的 Content-Type 和 Cache-Control ，这是保证流式响应不被浏览器或插件缓冲的关键。很多教程漏掉了 res.setHeader('Connection', 'keep-alive') ，结果就是响应断断续续，用户体验极差。把这个文件保存好，然后在终端里运行 node server.js ，你应该能看到 ✅ DeepSeek 代理服务已启动... 的提示。这就意味着，你的“翻译官”已经上岗了。

3.3 Claude Code 插件配置：三个必须填对的字段

插件配置是另一个高频出错点。很多人以为只要填对 API Key 就行，其实不然。Claude Code 的设置项里，有三个字段是联动的，必须协同填写：

API Base URL ：填你本地代理服务的地址，即 http://localhost:3000 。注意，这里 不能加 /v1/chat/completions ，也不能加 https 。插件内部会自动拼接路径，如果你填 http://localhost:3000/v1/chat/completions ，它最终会发出 http://localhost:3000/v1/chat/completions/v1/chat/completions 的请求，必然 404。
API Key ：填你从 DeepSeek 官网获取的 API Key。获取方法很简单：注册登录后，进入 “API Keys” 页面，点击 “Create new key”，复制生成的 sk-xxx 字符串。这里有个大坑：DeepSeek 的 Key 是区分环境的， sk-xxx 开头的是生产环境 Key，而测试环境 Key 是 sk-test-xxx 。如果你用测试 Key 去调生产 API，会报 403 Forbidden 。所以，务必确认你创建的是 “Production” 类型的 Key。
Model Name ：填 deepseek-chat 。这是 DeepSeek 官方模型的唯一标识名。Claude Code 插件会把这个值作为 model 字段，放进请求体里。如果你填 deepseek-coder 或 deepseek-vl ，DeepSeek API 会返回 {"error":{"message":"The model xxx does not exist."}} 。这个字段名，必须一字不差，大小写敏感。

填完这三个，重启 VS Code，或者在命令面板（ Ctrl+Shift+P ）里输入 Claude Code: Reload Extension ，让插件重新加载配置。这时，当你在一个 .js 文件里选中一段代码，右键选择 Claude Code: Explain Selection ，插件就会向 http://localhost:3000/v1/chat/completions 发起请求，你的 server.js 会捕获它，加上 Key，转发给 DeepSeek，再把响应原样（经过流式头修正）传回来。整个过程，对用户完全透明。

4. 实操过程与核心环节实现：从启动到调试的完整链路

4.1 启动代理服务并验证连通性

启动服务只是第一步，我们必须亲手验证它是否真的在工作。打开一个新的终端窗口，执行：

curl -X POST http://localhost:3000/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer sk-your-deepseek-key-here" \
  -d '{
    "model": "deepseek-chat",
    "messages": [{"role": "user", "content": "你好"}],
    "stream": false
  }'

把 sk-your-deepseek-key-here 替换成你的真实 Key。如果一切顺利，你会看到一长串 JSON 响应，里面包含 choices[0].message.content 字段，内容应该是“你好”或者类似的中文回复。这证明代理服务的“请求转发”功能是通的。但请注意，这个命令用的是 stream: false （非流式），它只能验证基础通路。真正的考验，在于流式。我们用一个更贴近插件行为的命令来测试：

curl -X POST http://localhost:3000/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer sk-your-deepseek-key-here" \
  -H "Accept: text/event-stream" \
  -d '{
    "model": "deepseek-chat",
    "messages": [{"role": "user", "content": "用 JavaScript 写一个计算斐波那契数列的函数"}],
    "stream": true
  }'

这次，你会看到屏幕上开始滚动输出 data: {...} 格式的文本，每一行都是一个 delta.content 的片段，比如 data: {"id":"xxx","object":"chat.completion.chunk","choices":[{"delta":{"content":"function"}}]} 。这说明流式通道也完全打通。如果你看到的是空白，或者报 502 Bad Gateway ，那问题一定出在 server.js 的 onProxyRes 配置上，回去检查 res.setHeader 的那几行。

4.2 在 VS Code 中触发首次请求并读取日志

现在，把插件配置好，打开一个空的 .py 文件，在里面随便写一行 print("hello") ，然后全选这段代码，右键 -> Claude Code: Explain Selection 。这时，插件会发起请求。为了看清发生了什么，我们需要打开 server.js 的日志。在 server.js 的 onProxyReq 函数里，加一行日志：

onProxyReq: (proxyReq, req, res) => {
  console.log(`➡️  收到请求: ${req.method} ${req.url}`);
  console.log(`➡️  请求头:`, req.headers);
  console.log(`➡️  请求体 (预览):`, req.body ? JSON.stringify(req.body).substring(0, 100) + "..." : "empty");
  proxyReq.setHeader('Authorization', `Bearer ${req.deepseekApiKey}`);
  proxyReq.setHeader('Content-Type', 'application/json');
},

同样，在 onProxyRes 里也加日志：

onProxyRes: (proxyRes, req, res) => {
  console.log(`⬅️  收到响应: ${proxyRes.statusCode} ${proxyRes.statusMessage}`);
  console.log(`⬅️  响应头:`, proxyRes.headers);
  if (proxyRes.headers['content-type']?.includes('text-event-stream')) {
    res.setHeader('Content-Type', 'text/event-stream');
    res.setHeader('Cache-Control', 'no-cache');
    res.setHeader('Connection', 'keep-alive');
  }
}

保存，重启 node server.js 。当你再次触发插件时，终端里会疯狂打印日志。重点关注 ➡️ 请求体 (预览) 这一行。你会发现，Claude Code 发送的 messages 数组里， role 字段全是 user 和 assistant ，没有 system ，这说明它已经自动适配了 DeepSeek 的要求。再看 ⬅️ 响应头 ，确认 content-type 确实是 text/event-stream 。这些日志，就是你调试的“X光片”，它能让你一眼看出问题出在网络层、协议层，还是模型层。

4.3 处理常见模型兼容性问题：system 角色与上下文长度

即使代理跑通了，你可能还会遇到“解释不了代码”或“回答很短”的问题。这通常不是代理的锅，而是模型本身的限制。DeepSeek Chat 的上下文窗口是 128K，听起来很大，但 Claude Code 在发送请求时，会把整个文件内容、光标附近的代码、以及它自己的一套指令模板，全部塞进 messages 。一个中等大小的 React 组件文件，轻松就占掉 30K token。当总长度逼近上限时，DeepSeek 会自动截断前面的 messages ，导致它“忘记”了你最初的提问。我的解决办法是： 在 server.js 里加一个简单的上下文裁剪逻辑 。在 onProxyReq 里，解析 req.body ，如果 messages 数组长度大于 5，就只保留最后 5 条（通常是最近的用户提问和模型回答），丢弃最前面的历史。代码如下：

onProxyReq: (proxyReq, req, res) => {
  // ... 前面的日志代码 ...

  // 尝试解析请求体
  let body;
  try {
    body = JSON.parse(req.body.toString());
  } catch (e) {
    // 如果解析失败，跳过裁剪
    body = req.body;
  }

  // 如果是 chat/completions 请求，且 messages 存在，进行裁剪
  if (body && Array.isArray(body.messages) && body.messages.length > 5) {
    console.log(`✂️  裁剪 messages，保留最后 5 条`);
    body.messages = body.messages.slice(-5);
  }

  // 将处理后的 body 写回 proxyReq
  if (body && typeof body === 'object') {
    proxyReq.write(JSON.stringify(body));
  }
}

这个改动非常小，但效果立竿见影。它不会影响单次问答的质量，却能极大提升长文件场景下的稳定性。另一个问题是 system 角色。虽然 DeepSeek 当前不支持，但未来版本可能会支持。为了代码的可维护性，我在 onProxyReq 里加了一个兼容层：如果检测到 messages[0].role === "system" ，就把它合并到 messages[1].content 的开头，并删除 messages[0] 。这样，既满足了当前 API 的要求，又为未来升级留了余地。

5. 常见问题与排查技巧实录：那些没人告诉你的“静默失败”

5.1 问题速查表：从现象反推根源

现象	最可能原因	快速验证方法	解决方案
插件无任何反应，VS Code 右下角不显示加载动画	代理服务未启动，或 `API Base URL` 填错	在浏览器访问 `http://localhost:3000` ，看是否返回 `Cannot GET /`	检查 `node server.js` 是否在运行；确认 URL 是 `http` 而非 `https` ，且没有多余路径
插件显示“Request failed with status code 401”	DeepSeek API Key 错误或过期	用 `curl` 命令直接调用 DeepSeek 官方 API（不经过代理）	重新去 DeepSeek 平台生成 Key，确认是 Production 类型
插件显示“Request failed with status code 400”，但无详细错误	`messages` 结构不合法，或 `model` 名称错误	查看 `server.js` 终端日志中的 `➡️ 请求体 (预览)`	检查 `model` 字段是否为 `deepseek-chat` ；确认 `messages` 中没有 `system` 角色
插件能启动，但回答非常简短（如只说“好的”）	上下文过长，被 DeepSeek 自动截断	查看日志中 `➡️ 请求体 (预览)` 的长度	在 `server.js` 中加入 `messages` 裁剪逻辑（见 4.3 节）
插件回答卡顿，几秒后才出第一字	流式响应头未正确设置	用 `curl` 测试流式请求，看是否立即输出 `data:`	检查 `server.js` 中 `onProxyRes` 的 `res.setHeader` 是否生效

这张表，是我踩了至少七次坑后总结出来的。它不追求理论完备，只解决你此刻最头疼的问题。

5.2 独家避坑技巧：关于 Key 管理与安全性

很多教程会教你把 API Key 直接写死在 server.js 里，比如 const DEEPSEEK_API_KEY = "sk-xxx" 。这是极其危险的做法。一旦你把这个文件提交到 GitHub，Key 就彻底泄露了。我的做法是： 用环境变量 + .env 文件 。首先，安装 dotenv 包： npm install dotenv 。然后，在项目根目录创建一个 .env 文件，内容只有一行：

DEEPSEEK_API_KEY=sk-your-real-key-here

接着，修改 server.js 的顶部：

require('dotenv').config(); // 加载 .env 文件

const express = require('express');
const { createProxyMiddleware } = require('http-proxy-middleware');

// ... 后面的代码保持不变 ...

// 在 onProxyReq 里，把 req.deepseekApiKey 的赋值逻辑改成：
app.use((req, res, next) => {
  const authHeader = req.headers.authorization;
  if (authHeader && authHeader.startsWith('Bearer ')) {
    req.deepseekApiKey = authHeader.split(' ')[1];
  } else {
    // 如果 Header 里没带，就用环境变量兜底（仅用于本地测试）
    req.deepseekApiKey = process.env.DEEPSEEK_API_KEY;
  }
  next();
});

最后， 在项目根目录创建一个 .gitignore 文件，里面写上 .env 。这样， .env 文件永远不会被上传到代码仓库，你的 Key 就安全了。这个技巧，是每个专业 Node.js 开发者的基本功，但它对小白来说，却是最容易被忽略的安全基石。

5.3 性能优化：让响应快一倍的两个小动作

代理服务本身是轻量的，但默认配置下，它会对每个请求都建立一个新的 TCP 连接，这在高并发时会产生明显延迟。我们可以用 http-proxy-middleware 的 agent 选项来启用连接池。在 createProxyMiddleware 的配置对象里，加上：

const https = require('https');
const http = require('http');

// 在 app.use 之前，创建 agent
const httpAgent = new http.Agent({ keepAlive: true });
const httpsAgent = new https.Agent({ keepAlive: true });

// 然后在 createProxyMiddleware 的配置里
app.use('/v1/chat/completions', createProxyMiddleware({
  // ... 其他配置 ...
  agent: httpsAgent, // 因为 DeepSeek API 是 https
}));

第二个优化，是给 express 应用加一个简单的健康检查端点。在 server.js 的末尾，加一行：

app.get('/health', (req, res) => {
  res.json({ status: 'ok', timestamp: new Date().toISOString() });
});

这样，你就可以用 curl http://localhost:3000/health 来快速确认服务是否存活，而不用等一个完整的 AI 请求。这两个小动作，加起来不到十行代码，却能让整个体验从“能用”变成“好用”。

6. 后续扩展与个人体会：从“跑起来”到“用得爽”

这个代理方案，只是一个起点。它解决了“能不能用”的问题，但离“用得爽”还有距离。我自己在用了一周后，做了几个小扩展，分享给你，或许能帮你少走些弯路。第一个是 多模型支持 。DeepSeek 有 deepseek-chat 和 deepseek-coder 两个主力模型，后者专为编程优化。我修改了 server.js ，让它能根据请求 URL 的路径来切换模型。比如，把 API Base URL 设为 http://localhost:3000/chat ，就走 deepseek-chat ；设为 http://localhost:3000/coder ，就走 deepseek-coder 。实现方式很简单，在 app.use 的路径匹配里做判断即可。第二个是 本地缓存 。对于重复的、简单的提问（比如“解释一下 setTimeout”），每次都去调 API 是浪费。我加了一个基于内存的 LRU 缓存，用 lru-cache 包，把 messages 的 JSON 字符串作为 key，把响应体作为 value，设置 5 分钟过期。这样，同样的问题问两遍，第二遍几乎是瞬回。第三个，也是最重要的体会： 不要迷信“一键安装” 。网络上流传的 npm install claude-code-deepseek 这种包，我全部试过，它们要么是过时的（用的旧版 OpenAI 协议），要么是恶意的（会偷偷上传你的代码片段）。真正的掌控感，来自于你亲手写的那三十行 server.js 。它不大，但它完全在你的掌控之中。每次插件给出一个惊艳的回答，你知道，那背后不是某个黑盒 API 的恩赐，而是你亲手搭建的、透明的、可审计的桥梁。这种感觉，是任何“一键安装”都无法给予的。所以，如果你今天只记住一件事，请记住： “跑起来”的价值，不在于它多快，而在于它完全属于你。