处理时间 | 处理记录 | 处理人 |
---|---|---|
20240711 11:20 | 对所有硬盘进行坏道检测,全绿都正常 | 刘建华 |
20240711 11:20 | 09 10这两天IPMI有内存报错P2E2 P1B1 | 刘建华 |
20240711 11:20 | P2E2换到P2E1 P1B1换到P1B2,开机测试 | 刘建华 |
20240711 17:20 | P1B2依旧报错,给业务反馈,重新购买两根内存 | 刘建华 |
20240711 17:20 | 对设备重新组RAID 具体为:5个2T机械,其中4个机械组RAID10,1个机械组RAID0;4个8T固态,组两个RAID1,6个2t固态,其中四个组RAID10,2个组RAID1 | 刘建华 |
2024071514:20 | 内存条已经更换,目前没有报错 | 刘建华 |
20240717 09:40 | cpu1和cpu2待机温度有点高80-90之前,取下cpu重新涂抹硅脂,待机温度40摄氏度左右 | 刘建华 |
20240717 18:30 | 设备已发走 | 刘建华 |
20240806 16:00 | 客户反馈,设备还是会重启,远程IPMI无报错,系统内无报错,客户描述pdu插了多台设备,怀疑是功率不够,下次客户到机房再联系排查问题 | 刘建华 |
20240808 14:00 | 设备依旧重启,现场电路比较复杂,无墙插,空开直接连接PDU,pdu接好几台设备,让学生从别的地方引出墙插,单独接设备,测试memtest64 50分钟,fpu30分钟都没有重启,目前客户在进行仿真测试 | 刘建华 |