以下是运行在Linux操作系统上的SLURM集群的常用终端命令集合,常用于高性能计算机 (HPC, High-performance Computing)的使用。
0. 使用 sbatch 提交任务
sbatch python_task.sh
1. 使用 squeue 查询节点上的任务列表
squeue -w xln01
2. 使用 scontrol show job 查询具体任务详情(包含该任务的最大可运行时间限制,CPU核心数,以及运存分配情况)
scontrol show job <JobID> 如 scontrol show job 17823121
3. **squeue** 默认只展示任务的概要信息,如果想直接用 squeue 查看所有任务的详细信息,可以使用 格式化输出选项,比如:
squeue -w xln01 -o “%.18i %.9P %.20j %.8u %.8T %.10M %.9l %.6D %R”
4. 要查询每个 Partition (如bigmem)的内存可用情况,你可以使用 sinfo 命令,搭配格式化输出选项:
sinfo -o “%.12P %.10a %.8l %.10e %.8m %.8c %.10d %N”
5. 查看每个分区的详细资源信息,包括最大内存限制和最大运行时长限制:
scontrol show partition
6. 进入交互式模式
srun –pty /bin/bash
7. 申请特定资源的交互式会话:
srun –partition=<partition_name> –nodes=1 –ntasks=1 –cpus-per-task=4 –mem=16G –time=01:00:00 –pty /bin/bash
如进入bigmem这个节点的交互式界面:
srun –partition=bigmem –nodes=1 –ntasks=1 –cpus-per-task=4 –mem=16G –time=01:00:00 –pty /bin/bash
如果想进入 Stata 18 的交互式命令界面,完整版的命令如下:
module load Stata/18
srun –partition=bigmem –nodes=1 –ntasks=1 –cpus-per-task=4 –mem=16G –time=01:00:00 –pty /bin/bash
stata
依次分别输入上述命令,可直接进入Stata的交互式命令界面
退出交互式界面:
exit
8. 启动交互式模式后,先加载R,然后可以直接进入R
module R
R
9. 在交互式模式的R中,退出R的命令如下:
q()
10. 彻底退出交互式模式:
exit
11. 取消一个正在运行的任务
scancel <JobID>
12. 查询bigmem分区的正在排队等待的各个任务的优先级
sprio -p bigmem
13. 显示 long partition的完整详细信息(long可以替换为bigmem等),包括该分区的所有配置,如时间限制、节点分配、最大核心数等。
scontrol show partition long | grep Nodes
14. 获取long partition 所有节点的总内存信息 (注:HPC的long partition 的每个节点最大只有128G内存)
sinfo -N -p long -o “%N %m”
15. 批量查询bigmem partition 所有节点的可用内存情况(最常用!)
for node in $(sinfo -N -p bigmem -o “%N”); do
echo -n “$node: “; scontrol show node $node | grep Memory
done
16. 遇到换行符问题如何解决。
使用sbatch命令提交task.sh后如果终端报错如下:
sbatch: error: Batch script contains DOS line breaks (\r\n)
sbatch: error: instead of expected UNIX line breaks (\n).
这意味着sh脚本文件包含 Windows(DOS)格式的换行符 \r\n,而 Linux 需要的是 UNIX 格式的换行符 \n。因此该sh文件无法运行在Linux上。
此时直接在终端上输入下面的命令即可解决(会将Windows的换行符自动转换为Linux的)。
sed -i ‘s/\r$//’ task_bd_3.sh
17. 查看已经完成的任务的内存占用情况
sacct -j <JobID> –format=JobID,JobName,MaxRSS,Elapsed,State
sacct -j 17864074 –format=JobID,JobName,MaxRSS,Elapsed,State


评论前必须登录!
立即登录 注册