slurm安装环境大致需要配置如下内容
配置固定ip,修改主机名和hosts文件(集群各节点本地解析主机名),关闭防火墙和SElinux,配置NTP(集群各节点时钟同步),配置NFS(集群各节点文件共享)
一、环境配置
1、配置固定ip
sudo su
apt install net-tools #安装net-tools
cd /etc/netplan
cp 00-installer-config.yaml 00-installer-config.yaml_before #备份以前的配置文件
vi 00-installer-config.yaml #编辑配置文件
修改为以下内容:
中间出现几次无效格式的提示,发现必须严格按照这个格式,每个网卡后面的缩进必须对齐,冒号后面必须有个空格。保存后运行以下命令使配置生效
netplan apply
2、修改主机名
vi /etc/hostname
修改为:slurm-m1
reboot #重启后生效
还需要把修改hosts文件
3、关闭防火墙
ufw status #查看防火墙状态
Status: inactive #默认关闭状态
ubuntu20.04防火墙基本操作参考:https://zhuanlan.zhihu.com/p/571124400
4、设置时区
timedatectl set-timezone Asia/Shanghai
时区设置基本操作参考:https://cloud.tencent.com/developer/article/1625722
5、设置NTP服务器
slurm需要管理端和计算节点时间同步,集群有可能在内网工作,因此需要在管理端启用NTP服务器
NTP服务器配置参考:https://blog.csdn.net/Dontla/article/details/133273628
6、设置NFS客户端实现文件共享
NFS客户端配置参考:https://bbs.huaweicloud.com/blogs/399864