处理时间 | 处理记录 | 处理人 |
---|---|---|
20210728-17:08 | 远程发现查看message及dmegs没有mcelog的报错,发现老师是终端执行后台脚本会重启和死机(没有用slurm和tmux),远程测试tmux后台执行正常,slurm重新配置后正常(之前是从节点目前改为单节点参数);老师说先使用,后续有问题再跟我们联系; | 宋旭蒙 |
20210729-11:00 | 远程发现设备一天重启四次,message及dmseg没有mcelog记录,IPMI有CPU 报错记录,与主管沟通后,不排除与算例或程序有关,目前待机跑linpark看是否正常; | 宋旭蒙 |
20210802-17:35 | 周五测试s-tui 运行到现在正常,关闭s-tui让老师正常运行算例,后续有问题与我们联系; | 宋旭蒙 |
20211014-15:00 | 同事王楷华更换主板CPU 运行测试正常; | 宋旭蒙 |
20211208-11:38 | 设备发回后 与业务确认设备使用正常 已解决; | 宋旭蒙 |