作业管理系统Torque在工作站/单机上的安装和使用

Web、Mail、Ftp、DNS、Proxy、VPN、Samba、LDAP 等基础网络服务
回复
头像
月下叹逍遥
论坛版主
帖子: 33994
注册时间: 2010-10-07 14:23
系统: Archdows10
来自: 某系某星某洲某国某省某市
联系:

作业管理系统Torque在工作站/单机上的安装和使用

#1

帖子 月下叹逍遥 » 2013-11-05 20:42

系统要求:Ubuntu12.04+或者Mint14+

具体设置:

1.获取本地Hostname,echo $HOSTNAME。修改hosts,注销127.0.1.1.

127.0.0.1 localhost改成127.0.0.1 localhost xxxxx torqueserver calnode1。其中,xxxx是HOSTNAME。

2.安装torque包,apt的干活:

$ sudo apt-get install torque-common libtorque2 libtorque2-dev torque-server torque-scheduler torque-mom torque-client

3.初始化:

$ sudo qterm // 先终止服务

$ sudo bash /usr/share/doc/torque-common/torque.setup $USER torqueserver // 建立默认服务器和队列,并把自己列为管理员

$ qmgr -c 'print server' // 查看默认配置的服务和队列

第三个命令,会列出一些列的东西,暂时无视掉。

4.配置计算节点,服务节点(其实就是本机了)

下面的步骤都要切换到root权限配置,即便是sudo 也会提示权限不足。

(1)创建服务节点

创建server_name文件,指明服务节点的名称为torqueserver

# echo "torqueserver" > /var/spool/torque/server_name

(2)添加计算节点

创建server_priv/nodes文件,指定利用名为calnode的节点的4个核做计算(具体几个核视个人情况而定)

# echo "calnode1 np=4" > /var/spool/torque/server_priv/nodes

(3)配置计算节点

创建mom_priv/config文件,告诉mom向IP为127.0.0.1的服务节点汇报

# echo "$pbs_server = 127.0.0.1” > /var/spool/torque/mom_priv/config

5.结束配置,第一次启动。

首先,关闭所有服务,

$sudo pkill "pbs_*"

第一次启动

$ sudo qterm -t quick #输入y。

启动所有服务

$sudo pbs_server

$sudo pbs_sched

$sudo pbs_mom

6.测试作业

$ echo 'sleep 20' | qsub

$ qstat

如果进程状态是R,则说明没有问题。

以后重启的时候记得启动pbs_server pbs_sched pbs_mom三个进程,或者添加到开机启动项里去。
浮生七十今三十,从此凄惶未可知
YJS小小鸟
帖子: 1
注册时间: 2014-05-10 15:03
系统: ubuntu

Re: 作业管理系统Torque在工作站/单机上的安装和使用

#2

帖子 YJS小小鸟 » 2014-05-10 15:10

#PBS -N object.bank.sh
#PBS -S /bin/bash
#PBS -e /home/xiaohe/object.bank.sh.err
#PBS -o /home/xiaohe/object.bank.sh.log
#PBS -l pmem=1
#PBS -l walltime=10:00:00
#PBS -l nodes=1:ppn=1
#PBS -t 1-4
#PBS -V
start_idx=$((($PBS_ARRAYID-1)*1+1))
for ((i=$start_idx;i<$start_idx+1;i++))
do
if [ $i -le 4 ]
then
script=$(sed -n -e "$i p" /home/xiaohe/example/e2/task.sh)
eval $script
fi
done

你好,上面是我要提交的作业脚本,可以运行,主要看
#PBS -e /home/xiaohe/object.bank.sh.err
#PBS -o /home/xiaohe/object.bank.sh.log这两行,我在/home/xiaohe/下根本找不到object.bank.sh.log 和object.bank.sh.err这两个输出结果文件。是不是我的torque设置的问题?求解答!
回复