Slurm基本命令介绍

Slurm(Simple Linux Utility for Resource Management):Linux 集群资源调度管理器,负责节点、CPU、内存、GPU 资源分配、任务排队、启停管理,你现在用的#SBATCH脚本就是 Slurm 作业脚本。

一、SBATCH 脚本注释参数(#SBATCH,写在脚本头部)

#!/bin/bash
#SBATCH -p a100        # -p/--partition:指定分区(队列名),你的A100卡就在a100分区
#SBATCH --gres=gpu:1   # --gres=gpu:N:申请N张GPU,A100=1张
#SBATCH --cpus-per-task=12 # 每个任务绑定CPU核心数
#SBATCH --mem=20G      # 申请总内存
#SBATCH -o xxx.out     # -o:标准输出日志
#SBATCH -e xxx.err     # -e:错误日志
#SBATCH --time=02:00:00 # 任务最大运行时长 时:分:秒,超时强制杀任务
#SBATCH -J AF_run      # -J/--job-name:任务名,对应%x
#SBATCH --nodelist=node01 # 指定机器运行(极少用)

占位符:%j=jobid、%x=任务名,就是你日志里58516110_AF-A0A444Z5D0_353.out来源。

二、核心提交 / 管理命令

1. 提交任务
sbatch run_af3_zn.sbatch    # 提交sbatch脚本入队
PEPID=ID1 sbatch xxx.sbatch # 环境变量传入脚本(你批量提交用法)
2. 查看任务
squeue                       # 查看全集群所有排队+运
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值