处理时间 | 处理记录 | 处理人 |
---|---|---|
20230823 | 学生反馈计算节点全部关机,远程查看 三台设备日志无异常,通过日志和学生沟通 ,三台设备从14号到昨天重启前都正常运行,查看UPS ,UPS运行正常; 通过node01 vnc访问node02 IPMI 日志无异常; 故让其先满载运行node02 测试不到五分钟,三台计算节点关机(其中两台待机状态下关机),因为三台计算节点都插在16A的PDU上面 故判断PDU存在问题 告知学生将PDU断电 其中一台计算节点插到10A的计算设备上满载运行 从中午十一点半运行到下午四点 设备运行正常;故判断16APDU存在问题。已联系采购发新的过去; | 宋旭蒙 |
20230905 | 确认是16A PDU存在问题 更换后正常 | 宋旭蒙 |
20230906 | 学生反馈openfoam集群计算报错: mca_base_component_repository_open: unable to open mca_btl_usnic: libpsm_infinipath.so.1: cannot open shared object file: No such file or directory (ignored) 脚本添加: export LD_LIBRARY_PATH=/usr/lib64/psm2-compat:$LD_LIBRARY_PATH 运行正常 | 宋旭蒙 |