想用caffe训练的时候采用多个GPU,于是训练的时候使用了参数--gpu=0,1,2,3
但报错,报告显示must be specified for multi-GPU mode
于是查看了caffe的Makefile.config中的USE_NCCL,已经设成1了。但CMakeLists.txt中的USE_NCCL仍为OFF。
于是直接在CMakeLists.txt中设为ON。
进入build文件夹,cmake ..
发现显示的内容中nccl是disable,于是在安装nccl
安装步骤为
$ git clone https://github.com/NVIDIA/nccl.git
$ cd nccl
$ sudo make install -j8
好了之后再去build 文件夹make all -j8
之后训练就好了。
注意:

多GPU接口只支持C/C++,以及训练。
博主在使用caffe进行多GPU训练时遇到报错,提示'must be specified for multi - GPU mode'。经检查,将CMakeLists.txt中的USE_NCCL设为ON,安装nccl后,重新编译训练成功。同时提醒多GPU接口仅支持C/C++及训练。

3219

被折叠的 条评论
为什么被折叠?



