处理时间 | 处理记录 | 处理人 |
---|---|---|
20240122-18:00 | 设备在运行过程中卡死,重启之后客户反馈进不去系统,主管协助排查发现BIOS中有两根内存报错,指导客户重新插拔内存发现还是不能正常进入系统,随后指导客户将P2的A1B1内存和旁边D1C1内存更换位置还是不行,之后指导学生将这四根内存全部拔下开机也还是不行,和客户约到明天尝试重置BIOS试试 | 马文 |
20240123-17:30 | 今日排查措施:1.指导客户进行BIOS电池放电操作,之后设备重启还是会在grub引导界面重启。2,指导客户设置IPMI地址,通过IPMI查看到有P2的a1和b1内存报错,之后指导客户取下相关内存,设备开机还是会在grub界面重启。3,升级主板BIOS为最新版本,并重置BIOS,升级BMC为最新版本,并重置BMC,设备开机还是和之前情况一样。4,通过查看IPMI又有P2的c1和f1内存报错,之后指导客户将cpu2内存全部拔下,之后重启还是和之前情况一样,随后设备只留cpu1a1内存还是和之前情况一样。5,制作微PE镜像,开机选择windows镜像,发现还是会蓝屏,报错代码WHEA UNCORRE | 马文 |
20240124-17:40 | 今日排查措施:1,再次更新BMC并重置,发现情况和之前一样,之后还是指导客户取下bios电池多放一会对设备进行放电,但操作完之后还是没有效果。2,制作windows系统安装盘,和客户沟通机械硬盘可以尝试用来安装windows系统进行测试,但在安装windows系统的时候还是会蓝屏,代码MACHINE CHECK EXCEPTION,又指导客户重新更换cpu1的单根内存,发现情况还是一样,3,指导客户取下固态硬盘,并再次取下BIOS电池进行放电,之后再次尝试安装系统,发现还是和之前一样蓝屏代码,ipmi提示:[CPU-0005] Configuration error - Assertion | 马文 |
20240305-17:00 | 联系学生再次尝试,目前单根内存开机还是会重启,之后又尝试取下BIOS电池放电,随后通过远程设备ipmi重启尝试发现还是在系统界面会重启 | 马文 |
20240312-11:00 | 现场再次取下主板BIOS电池放电并安装一根内存开机尝试,情况和之前一样,还是到系统界面会重启,之后关机断电取下cpu2,开机发现正常进入系统,之后将cpu2单独放在cpu1位置发现设备还是不能正常点亮,之后更换带去的新的cpu,设备正常进入系统,内存全部正常识别,学生使用软件测试效率正常 | 马文 |
20240313-11:00 | 有问题的cpu2带回在公司使用测试过的主板进行内存单点也点不起来,更换了两根单独内存也是同样情况,目前已交给同事进行售后 | 马文 |