从零开始安装slurm作业调度系统Slurm-Ubuntu{超详细}

发布网友 发布时间:2024-10-23 22:23

我来回答

1个回答

热心网友 时间:1小时前

为了从零开始安装Slurm作业调度系统在Ubuntu系统上,首先,请确保已使用root权限操作。

安装过程主要分为以下几个步骤:

1. 访问Slurm官方文档和相关社区教程以获取最新安装指南,链接如下:官网、cndaqiang.github.io、知乎文章、guanjihuan.com。

2. 执行安装命令。

3. 使用“slurm -C”命令获取计算机名字,修改配置文件slurm.conf中ControlMachine、NodeName、Nodes字段。

4. 在系统中创建空目录slurm-llnl。

5. 在用户根目录下创建slurm.sh脚本,输入特定配置,保存并退出。

6. 启动Slurm服务,确保每次开机都执行该步骤,或将其添加至系统启动脚本中。

7. 若配置出现问题,如节点状态异常(down或offline),在更新配置后重启Slurm服务,尝试使用命令解决问题。

8. 通过安装slurm-wlm-torque包,实现使用pbs命令控制Slurm,例如pbsnodes、qstat、qsub等。

9. 编写并提交作业脚本(job.sh)。

10. 使用Slurm命令提交作业,同时查看作业状态与取消作业。

Slurm与pbs是两种常见的作业调度系统,它们在功能、设计上有所不同,适用于不同的计算环境与需求。

请关注WeChat公众号:“量子咖啡喵”以获取更多技术支持与交流机会。

欢迎参与讨论与指正,引用时请标明来源。
声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
E-MAIL:11247931@qq.com