LSF的排错
上一篇 /
下一篇 2008-03-24 21:37:52
/ 个人分类:系统管理
周六,在服务器集群中添加一台systest。
配置为2* XEON 5430 CPU,8 * 2GFBDIMMM 667 Memory
通过添加新的服务器进入队列的手册,添加之后服务器可以通过lsload bhosts等命令查看,但是bsub之后的job,没有任何一个在这台服务器上执行。
1. systest#ps -ef|grep lsf
可以看到进程,使用的是2.6 ia32e的软件。
2. systest#vi lsb.hosts
查看systest这台服务器的定义,可以看到,其Model为X86
3.admin$badmin reconfig
没有错误信息提示
4.admin$bsub -m systest
发现提示服务器不在允许范围,仔细检查队列配置文件lsb.queue,发现文件中normal队列部分,配置了HOSTS = .....这里没有定义systest这台服务器。其默认配置为所有服务器。所以我在这里可以选择#HOSTS 或者添加systest。
然后通过$bsub -m systest sleep 600,发现程序可以在systest上执行了。
导入论坛
收藏
分享给好友
管理
举报
TAG:
LSF