实验室来了台别人用剩下的服务器主机,需要重装给我们用来跑模型,下面记录了整个踩坑过程,很多概念完全不知道是什么 ,走过一遍贼崩溃,但也算顺利完成了,特此记录。
(此教程适用于重装或全新linux主机)
一、系统重装
整个流程总结下来就是:
在U盘中下一个镜像,做一个启动盘,插在主机上,跟着步骤选择即可完成系统重装。
1、选择你想要安装的linux系统版本,这里我们选择的是20.04版本,下载iso文件(即镜像文件)
https://mirrors.tuna.tsinghua.edu.cn/ubuntu-releases/20.04/

2、下载ultrasio软件用于制作启动盘
下载链接在这:下载链接在这:https://www.ultraiso.com/
要做的其实就是把iso文件通过这个软件下载到空u盘中,这个教程很多,这里就不细说
3、将做好的启动盘(U盘)插在主机上
重启主机,按f11或f12进入boot界面,找到Boot Sequence选择启动顺序,找到 U 盘对应的启动项(一般标识为 USB 相关),拖拽或上下移动到第一位,保存后重启即可。
4、顺利进入开始下载
整个过程提示都比较清晰,会让你确认是否重装等等,一切选择完成后进入下载,下载需要等待一段时间,下载完成后会提示拔出u盘,完成重装
二、ssh远程连接
第一个讲这个的目的是,做好这个就可以在自己的电脑上用powershell通过ssh连接用指令控制服务器主机下载各种东西,就可以远离又脏又吵的机房了555555,谁不想敲自己工位的好键盘呢?
1、编辑 SSH 配置文件:
sudo nano /etc/ssh/sshd_config
找到并修改(如果前面有注释 # 则去掉)
PasswordAuthentication yes
...
...
PermitRootLogin yes
2、重启ssh服务
sudo systemctl restart ssh
3、检查防火墙端口(默认22)是否开放
sudo ufw allow 22/tcp
sudo ufw enable
sudo ufw status
三、远程桌面连接
使用windows自带的“远程桌面连接”服务器(Xrdp, remote desktop protocol)

1、在Ubuntu上安装XRDP
sudo apt updatesudo apt install xrdp
输入命令确认是否安装成功
xrdp --version
可以先试着连接一下服务器,ip+端口号(3389),ip通过ifconfig查看

2、黑屏问题
sudo apt install vim下 载一个文本编辑工具,然后执行下面代码打开这个startwm.sh文件,按e选择进入编辑模式
sudo vim /etc/xrdp/startwm.sh

在文件最顶部添加如下内容(放在 # test if... 那些检测语句前面):
unset DBUS_SESSION_BUS_ADDRESS
unset XDG_RUNTIME_DIR
完成后执行一下代码重启即可。
sudo systemctl restart xrdp.service
四、磁盘分区
首先查看系统中的磁盘和分区情况:
sudo lsblk -f

sda1、sda2、sdb... 是 Linux 系统中对磁盘和磁盘分区的命名标识,用于区分不同的物理磁盘和同一磁盘上的不同分区。比如这里sda有多个分区,有的挂载了有的没挂载。sdb则是我的一块独立硬盘,我们接下来就要把他挂载起来作为未来存储数据的盘,sda盘则作为系统分区不去动他了。如果没有sdb的话,从sda的ext4作为数据存储也是可以的。
输入指令查看sdb的情况:
sudo fdisk -l /dev/sdb
接下来让linux看见sdb,把他放在data目录下
sudo mkdir -p /data
格式化分区:(会清空这个硬盘所有数据,谨慎,确保没有前人还需要的重要资料)
sudo mkfs.ext4 /dev/sdb1
挂载分区:
sudo mount /dev/sdb1 /data
执行:
df -h
设置开机自动挂载:
sudo nano /etc/fstab
验证配置是否正确:(无报错即可)
sudo mount -a
授予完全访问权限并创建一个快捷方式,这样就可以在home看到 /data 这个文件夹
sudo chmod -R 777 /data
ln -s /data ~/data
四、安装conda环境
cd /data # 或者你希望安装的路径,安装Miniconda
wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh
bash Miniconda3-latest-Linux-x86_64.sh
选择安装路径,例如: /data/miniconda3
环境生效:
source ~/.bashrc
五、安装CUDA驱动
查看服务器显卡配置
lspci | grep -i nvidia

进入NVIDIA主页找到对应显卡驱动并下载:https://www.nvidia.cn/drivers/lookup/
如图,本机一张 ID2204 对应的是一张GeForce RTX 3090型号显卡,则查找对应驱动

把下载好的.run文件放在服务器文件夹中
安装gcc、make和相关依赖
sudo apt install gcc
sudo apt install make
sudo apt install -y build-essential dkms
赋予安装权限并开始安装(把这里的run文件替换成你下载的对应驱动文件)
sudo chmod +x NVIDIA-Linux-x86_64-580.105.08.run
sudo ./NVIDIA-Linux-x86_64-580.105.08.run
这里选择NIVIDIA Proprietary,然后一路选OK就行

然后重启系统即可
sudo reboot
通过指令查看显卡和驱动安装情况正常
nvidia-smi

154

被折叠的 条评论
为什么被折叠?



