LSF的排错

上一篇 / 下一篇  2008-03-24 21:37:52 / 个人分类:系统管理

周六,在服务器集群中添加一台systest。

配置为2* XEON 5430 CPU,8 * 2GFBDIMMM 667 Memory

通过添加新的服务器进入队列的手册,添加之后服务器可以通过lsload bhosts等命令查看,但是bsub之后的job,没有任何一个在这台服务器上执行。

1. systest#ps -ef|grep lsf

可以看到进程,使用的是2.6 ia32e的软件。

2. systest#vi lsb.hosts

查看systest这台服务器的定义,可以看到,其Model为X86

3.admin$badmin reconfig

没有错误信息提示

4.admin$bsub -m systest

发现提示服务器不在允许范围,仔细检查队列配置文件lsb.queue,发现文件中normal队列部分,配置了HOSTS = .....这里没有定义systest这台服务器。其默认配置为所有服务器。所以我在这里可以选择#HOSTS 或者添加systest。

然后通过$bsub -m systest sleep 600,发现程序可以在systest上执行了。


TAG: LSF

 

评分:0

我来说两句

显示全部

:loveliness: :handshake :victory: :funk: :time: :kiss: :call: :hug: :lol :'( :Q :L ;P :$ :P :o :@ :D :( :)

Open Toolbar