从零开始安装slurm作业调度系统Slurm-Ubuntu{超详细}
发布网友
发布时间:2024-10-23 22:23
我来回答
共1个回答
热心网友
时间:1小时前
为了从零开始安装Slurm作业调度系统在Ubuntu系统上,首先,请确保已使用root权限操作。
安装过程主要分为以下几个步骤:
1. 访问Slurm官方文档和相关社区教程以获取最新安装指南,链接如下:官网、cndaqiang.github.io、知乎文章、guanjihuan.com。
2. 执行安装命令。
3. 使用“slurm -C”命令获取计算机名字,修改配置文件slurm.conf中ControlMachine、NodeName、Nodes字段。
4. 在系统中创建空目录slurm-llnl。
5. 在用户根目录下创建slurm.sh脚本,输入特定配置,保存并退出。
6. 启动Slurm服务,确保每次开机都执行该步骤,或将其添加至系统启动脚本中。
7. 若配置出现问题,如节点状态异常(down或offline),在更新配置后重启Slurm服务,尝试使用命令解决问题。
8. 通过安装slurm-wlm-torque包,实现使用pbs命令控制Slurm,例如pbsnodes、qstat、qsub等。
9. 编写并提交作业脚本(job.sh)。
10. 使用Slurm命令提交作业,同时查看作业状态与取消作业。
Slurm与pbs是两种常见的作业调度系统,它们在功能、设计上有所不同,适用于不同的计算环境与需求。
请关注WeChat公众号:“量子咖啡喵”以获取更多技术支持与交流机会。
欢迎参与讨论与指正,引用时请标明来源。