解决PyTorch报错“cublas runtime error : library not initialized”

最新推荐文章于 2026-03-31 10:29:14 发布

原创最新推荐文章于 2026-03-31 10:29:14 发布 · 1.4w 阅读

1 ·

本内容遵循CC 4.0 BY-SA版权协议

标签

#深度学习 #Python #PyTorch #CUDA

Python 同时被 3 个专栏收录

47 篇文章

订阅专栏

数字图像处理、模式识别与深度学习

46 篇文章

订阅专栏

深度学习（Deep learning）

45 篇文章

订阅专栏

在运行深度学习训练代码时，遇到GPU显存不足导致的RuntimeError。通过排查发现是由于另一个处于debug状态的CUDA程序占用显存。停止该程序后，问题得到解决。

运行一段深度学习的training代码时遇到如下错误：

  File "train_mdnet.py", line 69, in train_mdnet
    neg_regions = neg_regions.cuda()
  File "/home/dodge/anaconda3/envs/py27_for_pytorch020/lib/python2.7/site-packages/torch/autograd/variable.py", line 279, in cuda
    return CudaTransfer.apply(self, device_id, async)
  File "/home/dodge/anaconda3/envs/py27_for_pytorch020/lib/python2.7/site-packages/torch/autograd/_functions/tensor.py", line 151, in forward
    return i.cuda(async=async)
  File "/home/dodge/anaconda3/envs/py27_for_pytorch020/lib/python2.7/site-packages/torch/_utils.py", line 66, in _cuda
    return new_type(self.size()).copy_(self, async)
RuntimeError: cuda runtime error (2) : out of memory at /opt/conda/conda-bld/pytorch_1511304568725/work/torch/lib/THC/generic/THCStorage.cu:66