当前时区为 UTC + 8 小时



发表新帖 回复这个主题  [ 2 篇帖子 ] 
作者 内容
1 楼 
 文章标题 : Ubuntu14.04LTS 中,计算节点安装SGE,部分信息不识别。
帖子发表于 : 2016-10-18 14:05 

注册: 2014-06-12 11:10
帖子: 2
系统: ubuntu12.0.4
送出感谢: 0 次
接收感谢: 0 次
小弟最近在搭建一个集群,服务器都是Ubuntu 14.04LTS 的系统。

现在在主节点的gridengine-client、gridengine-common、gridengine-master、gridengine-qmon已经安装好并配置完,计算节点的gridengine-client、gridengine-common也已经配置完成。但是现在qhost只有node1有内存、loading率等信息,其他的几个节点的信息都是“-”,如下:

HOSTNAME ARCH NCPU LOAD MEMTOT MEMUSE SWAPTO SWAPUS
-------------------------------------------------------------------------------
global - - - - - - -
master-ubuntu14server lx26-amd64 4 0.01 31.4G 292.0M 0.0 0.0
node1 lx26-amd64 12 0.01 62.9G 439.6M 0.0 0.0
node2 - - - - - - -
node3 - - - - - - -
node4 - - - - - - -
node5 - - - - - - -
node6 - - - - - - -


把这些节点全部放到队列all.q里面,然后qsub -cwd -l h=node1,任务会Eqw,qstat -j查看信息,如下:

queue instance "all.q@node4" dropped because it is overloaded: no value for complex attribute "np_load_avg"
queue instance "all.q@node6" dropped because it is overloaded: no value for complex attribute "np_load_avg"
queue instance "all.q@node3" dropped because it is overloaded: no value for complex attribute "np_load_avg"
queue instance "all.q@node5" dropped because it is overloaded: no value for complex attribute "np_load_avg"
queue instance "all.q@node2" dropped because it is overloaded: no value for complex attribute "np_load_avg"
Job is in error state

这个错误信息,我谷歌的结果是:不能提供有用的信息用来判断问题在哪里。

单独将node1放到node1.q,然后qsub测试脚本,是没有问题的。

求教!有没有哪位大神遇到过这种情况?该怎么解决?


页首
 用户资料  
 
2 楼 
 文章标题 : Re: Ubuntu14.04LTS 中,计算节点安装SGE,部分信息不识别。
帖子发表于 : 2016-10-18 19:29 
头像

注册: 2008-09-18 13:11
帖子: 2781
送出感谢: 1
接收感谢: 453
你这个给人的感觉就是master和其他几个节点之间没有连通,检查下防火墙设置,抓下数据包看看?


页首
 用户资料  
 
显示帖子 :  排序  
发表新帖 回复这个主题  [ 2 篇帖子 ] 

当前时区为 UTC + 8 小时


在线用户

正在浏览此版面的用户:没有注册用户 和 1 位游客


不能 在这个版面发表主题
不能 在这个版面回复主题
不能 在这个版面编辑帖子
不能 在这个版面删除帖子
不能 在这个版面提交附件

前往 :  
本站点为公益性站点,用于推广开源自由软件,由 DiaHosting VPSBudgetVM VPS 提供服务。
我们认为:软件应可免费取得,软件工具在各种语言环境下皆可使用,且不会有任何功能上的差异;
人们应有定制和修改软件的自由,且方式不受限制,只要他们自认为合适。

Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group
简体中文语系由 王笑宇 翻译