정보공유

openhpc - stateful provisioning node 에서 발생한 문제 두가지

CheekyKite 2018. 11. 6.

openhpc - stateful provisioning node 에서 발생한 문제 두 가지


1. nvidia driver 설치 안됨. 

(기타 kernel source를 필요로 하는 패키지들은 모두 같은 문제 예상)


/etc/warewulf/vnfs.conf 에서 /usr/src 가 제외되어 있으므로

설치된 OS 에 kernel source 가 없어 module 생성이 안됨.


[root@c43 ~]# ll /lib/modules/3.10.0-862.14.4.el7.x86_64/

lrwxrwxrwx  1 root root     43 Nov  2 09:56 build -> /usr/src/kernels/3.10.0-862.14.4.el7.x86

lrwxrwxrwx  1 root root      5 Nov  2 09:56 source -> build


해결책 a. exclude += /usr/src 주석처리 후 이미지 다시 생성

해결책 b. yum reinstall kernel-devel-3.xx.x....



2. 부팅후 eth0 이 자동으로 ifup 안됨.

정확한 원인은 모르겠으나 다른 ifcfg 파일(ib0) 과 비교해 보니 

"DEVTIMEOUT=5"  값이 없어서 추가 후 해결 되었습니다. 


[root@c43 network-scripts]# 

[root@c43 network-scripts]# cat ifcfg-eth0

This was created by the Warewulf bootstrap

DEVICE=eth0

BOOTPROTO=static

ONBOOT=yes

IPADDR=xx.xx.xx.x

NETMASK=255.255.255.0

GATEWAY=xx.xx.xx.x

HWADDR=xx:xx:xx:xx:xx:xx

[root@c43 network-scripts]#

[root@c43 network-scripts]# cat ifcfg-ib0

DEVICE=ib0

BOOTPROTO=static

IPADDR=xx.xx.xx.x

NETMASK=255.255.255.0

ONBOOT=yes

NM_CONTROLLED=no

DEVTIMEOUT=5

[root@c43 network-scripts]#

[root@c43 network-scripts]#

[root@c43 network-scripts]# echo "DEVTIMEOUT=5" >> ifcfg-eth0
[root@c43 network-scripts]#
[root@c43 network-scripts]# reboot



댓글