如果你只是个人学习slurm的用法,可以使用docker部署,简单快捷,【slurm】二、docker部署slurm集群和jupyter,并支持使用slurm提交作业 - 空山人语-IT技术分享学习网站
废话少说,教程送上
1、节点信息
三台服务器
控制节点:10.2.88.100 controller
计算节点1:10.2.88.101 node1
计算节点2:10.2.88.102 node2
2、修改hosts(三节点)
vim /etc/hosts
加上
10.2.88.100 controller
10.2.88.101 node1
10.2.88.102 node2
3、免密登录(控制节点)
ssh-keygen
ssh-copy-id -i /root/.ssh/id_rsa root@node1
ssh-copy-id -i /root/.ssh/id_rsa root@node2
后两步需要先输入yes,在输入密码。
4、关闭防火墙和selinux(三节点)
systemctl stop firewalld
setenforce 0
sed -i "s/SELINUX=enforcing/SELINUX=disable/" /etc/selinux/config
5、添加用户(三节点)
useradd -u 1100 munge
useradd -u 1101 slurm
6、安装软件(三节点)
控制节点:yum install -y slurm slurm-perlapi slurm-slurmctld slurm-sl

本文详细指导了如何在CentOS7环境中,使用Docker部署Slurm集群,包括设置节点信息、修改hosts、配置SSH免密登录、关闭防火墙和SELinux,以及安装、配置Slurm、Munge、Jupyter等组件,最终实现作业管理和资源共享。

7121

被折叠的 条评论
为什么被折叠?



