处理时间 | 处理记录 | 处理人 |
---|---|---|
20220905 | 远程发现ntp服务正常 但1 2 3节点message日志有有localhost报错,处理发现三台设备/etc/hosts下 localhost被注释(默认不注释) 取消注释后 调试正常 后续有问题让学生联系我们; | 宋旭蒙 |
20220911 | 学生反馈02 03节点状态为down 远程发现02 03的slurmd服务运行失败 重启服务后解决,计划下周二远程看下日志,判断下原因; | 宋旭蒙 |
202209013 | 远程发现02 03节点日志并无异常,使用who -b对三台节点查看 发现设备均在 20220910-11:22重启 询问学生发现是他们那天设备下线了 而后没有检查02 03 节点slurmd服务状态 已解决 | 宋旭蒙 |