文章目录
- 前言
- 1、显卡驱动安装
- 2、torch - torchvision - python 版本对应关系(==更推荐后面第7部分的一键安装,简单省事==)
- 3、cuda - torch-python 版本对应关系
- 4、确定cuda的版本为11.1,cudnn的版本为8.9.0,进入以下链接进行下载
- 5、cuda的安装
- 6、cudnn的安装
- 7、torch和torchvison的安装
- 8、torch和torchvison的卸载
- 9、cuda和cudnn的卸载
- 10、win10安装Ubuntu系统
- 11、ROS安装
- 总结
- 参考文章
前言
本文主要介绍在ubuntu20下根据自己的python版本来确定torch版本,从而确定cuda和cudnn版本完成安装(注意,本文可能会同时看到cuda11和cuda10,因为是第一次安装cuda10在3060显卡跑不起来就换成cuda11了),本文版本为python-3.8,torch-1.8.0,torchvision-0.9.0,cuda-11.1.1,cudnn-8.9.0。
1、显卡驱动安装
(1)通过以下命令查看匹配的驱动:
ubuntu-drivers devices

从上图看到recommended 470,故安装470版本的驱动
(2)驱动安装方法1,
sudo ubuntu-drivers autoinstall
(3) 推荐 驱动安装方法2,进入官网下载对应的版本

(4)安装相关依赖,
sudo apt-get install libprotobuf-dev libleveldb-dev libsnappy-dev libopencv-dev libhdf5-serial-dev protobuf-compiler
sudo apt-get install --no-install-recommends libboost-all-dev
sudo apt-get install libopenblas-dev liblapack-dev libatlas-base-dev
sudo apt-get install libgflags-dev libgoogle-glog-dev liblmdb-dev
(5) 禁用系统默认显卡驱动,打开文件
sudo gedit /etc/modprobe.d/blacklist.conf
在文件末尾输入,
blacklist nouveau
options nouveau modeset=0
保存(ctrl+s)后手动更新;
sudo update-initramfs -u
重启后输入以下命令,无输出则禁用成功,
lsmod | grep nouveau
(6)配置环境变量,gedit命令打开配置文件:
sudo gedit ~/.bashrc
在文件末尾输入,
export LD_LIBRARY_PATH=/usr/lib/x86_64-linux-gnu:$LD_LIBRARY_PATH
export LD_LIBRARY_PATH=/lib/x86_64-linux-gnu:$LD_LIBRARY_PATH
然后,通过下面命令更新以下,
source ~/.bashrc
(7)安装NVIDIA驱动
sudo chmod a+x NVIDIA-Linux-x86_64-530.41.03.run
sudo sh NVIDIA-Linux-x86_64-530.41.03.run --no-opengl-files --no-x-check --no-nouveau-check
(8)安装NVIDIA驱动时的选项
1.The distribution-provided pre-install script failed! Are you sure you want to continue?
“Yes”
2.Would you like to register the kernel module souces with DKMS? This will allow DKMS to automatically build a new module, if you install a different kernel later?
“No”
3.Nvidia’s 32-bit compatibility libraries?
“No”
4.Would you like to run the nvidia-xconfigutility to automatically update your x configuration so that the NVIDIA x driver will be used when you restart x? Any pre-existing x confile will be backed up.
“Yes”
(9)查看是否安装成功
nvcc-smi

(10)卸载驱动,
sudo apt-get purge nvidia*
sudo apt-get --purge remove "*nvidia*"
2、torch - torchvision - python 版本对应关系(更推荐后面第7部分的一键安装,简单省事)
根据自己的python版本确认待安装的torch版本

3、cuda - torch-python 版本对应关系
根据第1步安装的torch版本来指定cuda版本

4、确定cuda的版本为11.1,cudnn的版本为8.9.0,进入以下链接进行下载
cuda下载链接: https://developer.nvidia.com/cuda-toolkit-archive ,有三个版本,本文下载的是cuda toolkit 10.1 update2。

cudnn下载链接: https://developer.nvidia.com/rdp/cudnn-archive,本文下载的是cudnn v8.9.0。

5、cuda的安装
(1)在第2步下载完成后,在终端输入安装
sudo sh cuda_11.1.1_455.32.00_linux.run
(2)安装中推荐换显卡驱动,不用换,选择 “continue” 即可,接着将第一行按 回车键 取消选中Driver,然后选择 install 进行安装。

(3)安装完成后显示:

(4)CUDA安装完成后,需要配置变量环境才能正常使用。首先在终端输入sudo gedit ~/.bashrc打开如下图所示的.bashrc文件。然后,如下图所示在.bashrc文件的最后添加以下CUDA环境变量配置信息
export PATH=$PATH:/usr/local/cuda/bin
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64
export LIBRARY_PATH=$LIBRARY_PATH:/usr/local/cuda/lib64
注意:上面的CUDA环境变量配置方法有很多,本文的配置方法中的cuda不要指定具体的版本,主要是为了电脑中多个CUDA版本的切换。最后,在终端输入source ~/.bashrc或者重新启终端使之生效。
(5)验证系统内部是否已经安装了cuda,输入命令,
nvcc -V

6、cudnn的安装
(1)在第2步下载完成后,在终端输入命令解压缩
tar -xf cudnn-linux-x86_64-8.9.0.131_cuda11-archive.tar.xz
(2)接着在当前终端输入以下命令,将相应的包移动到cuda完成cudnn的安装:
sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*
(3)验证 cudnn 安装信息,输入以下命令,注意旧版查看版本信息在cudnn.h , 新版本的版本信息在 cudnn_version.h,具体的进入相应路径查看
sudo cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2
(4)返回信息以下,表明cudnn安装的版本为7.6.3(这是最初安装的版本),

7、torch和torchvison的安装
十分推荐一键安装(官网:https://pytorch.org/get-started/previous-versions/ ):
pip install torch==1.8.0+cu111 torchvision==0.9.0+cu111 torchaudio==0.8.0 -f https://download.pytorch.org/whl/torch_stable.html
(1)下载链接: https://download.pytorch.org/whl/torch_stable.html,注意在ubuntu下,torch下载 cu101/torch-1.4.0-cp27mu-linux_x86_64.whl ,torchvison下载 cu101/torchvison-0.5.0-cp27mu-linux_x86_64.whl。


(2)下载完成后通过 pip install +文件名 安装即可,其中 -verbos 显示安装进程,如
pip install torch-1.4.0-cp27-cp27mu-linux_x86_64.whl -erbose
pip install torchvision-0.5.0-cp27-cp27mu-linux_x86_64.whl
(3)至此,安装完成,现在验证cuda的安装,输入命令,返回 Ture 则cudn可用
import torch
print(torch.cuda.is_available())

8、torch和torchvison的卸载
(1)通过pip uninstall 方式卸载,
pip uninstall torch
pip uninstall torchvision
9、cuda和cudnn的卸载
(1)对于cuda 10及以前的版本通过下面命令卸载,
cd /usr/local/cuda-10.0/bin/
sudo ./uninstall_cuda_10.0.pl
sudo rm -rf /usr/local/cuda-10.0
(2)对于cuda 10.1及以后的版本通过下面命令卸载,
cd /usr/local/cuda-10.1/bin/
sudo ./cuda-uninstaller
sudo rm -rf /usr/local/cuda-10.1
(3)删除已安装的cuDNN文件,
sudo rm -rf /usr/local/cuda/include/cudnn.h
sudo rm -rf /usr/local/cuda/lib64/libcudnn*
10、win10安装Ubuntu系统
首先用u盘烧录一个启动盘,我把第二块固态硬盘(1号)直接作为ubuntu系统盘,所以在磁盘管理将1号磁盘删除卷,变成未分配状态
重启时按F2(不同电脑不一样),进入BIOS,选择U盘启动,
然后开始安装,网上教程很多,注意,选择最小安装即可,在启动盘引导这儿比较麻烦,懒人做法是直接让电脑分配(新分区的类型:主分区;新分区的位置:空间起始位置;用于:Ext4日志文件系统;挂载点: / ,这样配置直接安装)。
11、ROS安装
直接用小鱼的一键安装,小鱼推荐哪个选项就填写哪个,
wget http://fishros.com/install -O fishros && . fishros
后面做ROS工程时,缺啥就安装啥。
TIPS:
懒人操作:
sudo apt-get install ros*controller*
sudo apt-get install ros-noetic-position-controllers
更新moveit,安装trac_ik_lib功能包:
终端命令:
$ sudo apt-get install ros-noetic-moveit-*
$ sudo apt-get install ros-noetic-trac-ik
检验当前工程文件缺少的依赖:
rosdep install --from-paths src --ignore-src --rosdistro=neotic -r -y
注意工程中用到的模型要复制到./gazebo/models文件夹下,这样gazebo加载很快。
总结
以上就是如何在ubuntu18下完成显卡驱动,cuda,torch,ubuntu系统的安装教程。
参考文章
[1] https://blog.csdn.net/qq_40630902/article/details/118356845
[2] https://blog.csdn.net/MumuziD/article/details/115362110
本文详细介绍了在Ubuntu 20.04系统下,如何针对NVIDIA 3060显卡安装和卸载驱动、CUDA 11.1、CUDNN 8.9.0,以及安装和卸载PyTorch的步骤。内容包括显卡驱动的匹配与安装、CUDA和CUDNN的下载与配置、PyTorch和torchvision的对应版本选择与安装、环境变量设置等。此外,还提到了Ubuntu系统的安装和ROS的快速安装方法。


2512

被折叠的 条评论
为什么被折叠?



