处理时间 | 处理记录 | 处理人 |
---|---|---|
20221017-11:00 | 学生反馈node04计算比较慢并且给出了node07的对比测试结果,远程连接到node04查看设备配置正常,计算的时候cpu核心频率也正常,尝试测试linpack看一下结果发现linpack测试内存调用不起来,并且cpu使用率也不正常,由于该设备泡水,目前和业务说了售后需要收费的问题,业务在群里也说了先将设备拉回检测,后续再说收费的事情 | 马文 |
20221018-16:00 | 去现场将设备拉回公司 | 马文 |
20221108-18:00 | 设备开机先进到主板idrac进行查看日志,没有发现异常,之后将idrac进行清空,之后进入系统硬件全部正常识别,但是测试linpack发现cpu只能调动百分之四十多,内存使用率上不去,重启两次idrac还是没有刷新出来 | 马文 |
20221109-14:10 | 将设备断电之后再次重新连接电源开机发现idrac日志里刷新出The system board Pfault fail-safe voltage is outside of range.网上查出来是主板Pfault故障保护电压超出范围。以及CPU 1 MEMABCD VDD PG voltage is outside of range,也是关于CPU 1 MEMABCD VDD PG电压超出范围 | 马文 |
20230106-14:20 | 设备从供应商处返修回来,检查配件齐全,设备一次性点亮,配置idrac,之后对设备进行测试 | 马文 |
20230106-18:00 | 设备返回供应商处更换了主板,戴尔官方技术更换主板 | 马文 |
20230110-12:00 | 设备已测试四天 linpack:2926.1637 Gflops;172000Ns 温度:CPU1 81摄氏度左右 ,CPU2 88摄氏度左右 | 马文 |
20230110-17:00 | 设备送去现场加入之前集群,学生进行测试,反馈计算效率正常 | 马文 |
20230112-15:00 | 询问学生这几天是否计算正常,学生反馈目前都正常,该售后完结 | 马文 |