处理时间 | 处理记录 | 处理人 |
---|---|---|
20230601-18:20 | 客户反馈设备突然关机,远程连接过去查看日志发现有相关mcelog报错,怀疑可能是内存问题导致,另外客户表示希望更改目录权限,并教一下他们如何使用xshell软件远程使用,截至下班设备还在测试中,暂未内存报错 | 马文 |
20230602-15:40 | 设备测试结束,温度以及内存都无异常,目前告知学生先正常使用,并帮助学生重新调试slurm集群,目前学生提交任务先计算并持续观察 | 马文 |
20230613-17:00 | 联系学生协助配置网络,之后通过IPMI查看系统硬件日志,通过查看发现有两三条由于内存温度过高导致的报错信息,通过查看系统日志也发现了相关时间段的重启信息,目前告知学生建议老师加装空调,这段时间还是继续观察 | 马文 |
20230810-11:30 | 联系学生询问服务器使用环境是否加装空调,以及服务器最近使用中有没有出现异常重启或者宕机情况,客户表示目前已加装空调,服务器运行一切正常,再没有出现过重启或宕机情况 | 马文 |