解决RuntimeError: Expected all tensors to be on the same device, but found at least two devices,

最新推荐文章于 2026-05-14 06:27:31 发布

原创最新推荐文章于 2026-05-14 06:27:31 发布 · 10w+ 阅读

本内容遵循CC 4.0 BY-SA版权协议

标签

#机器学习

本文探讨了在深度学习中常见的CUDA和CPU设备兼容问题，包括RuntimeError关于设备不一致的错误，以及如何通过检查设备并统一变量放置来修复。重点讲解了addmm操作时Tensor位置错误的解决方法。

Qwen3-32B-Chat 私有部署镜像 | RTX4090D 24G 显存 CUDA12.4 优化版

Qwen

文本生成

Qwen3

本镜像基于 RTX 4090D 24GB 显存 + CUDA 12.4 + 驱动 550.90.07 深度优化，内置完整运行环境与 Qwen3-32B 模型依赖，开箱即用。

原因：参与运算的两个或多个变量，有的在CPU上，有的在GPU上

解决：

首先找到报错的行，看看计算时都用到哪些变量或者数据，然后在调试模式下使用.is_cuda这个属性去查看到底哪些是在GPU上，哪些是在CPU上，然后把它们统一都放在CPU，或者统一放在GPU上就可以。
如果增加了变量，需要将新增加的变量也搬到GPU上去

g.ndata['norm'] = norm.unsqueeze(1)
g = g.to(device)

为了使模型在GPU上进行计算，需要将变量和模型都增加.to(device)，都搬到GPU上去即可

device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')

g = g.to(device)

model=model.to(device)

您可能感兴趣的与本文相关的镜像

Qwen3-32B-Chat 私有部署镜像 | RTX4090D 24G 显存 CUDA12.4 优化版

Qwen

文本生成

Qwen3

本镜像基于 RTX 4090D 24GB 显存 + CUDA 12.4 + 驱动 550.90.07 深度优化，内置完整运行环境与 Qwen3-32B 模型依赖，开箱即用。