硕星内部系统-技术部


石家庄铁道大学秦胜建   售后提交时间: 2024.1.22  售后完成时间: 2024.03.13-17:44:18    打印


目前状态: 完成
负责业务: 师玉焕
负责技术: 马文
业务电话: 17792493252
客户联系方式:
马文有微信
售后情况:
服务器司机

处理记录   
处理时间处理记录处理人
20240122-18:00设备在运行过程中卡死,重启之后客户反馈进不去系统,主管协助排查发现BIOS中有两根内存报错,指导客户重新插拔内存发现还是不能正常进入系统,随后指导客户将P2的A1B1内存和旁边D1C1内存更换位置还是不行,之后指导学生将这四根内存全部拔下开机也还是不行,和客户约到明天尝试重置BIOS试试马文
20240123-17:30今日排查措施:1.指导客户进行BIOS电池放电操作,之后设备重启还是会在grub引导界面重启。2,指导客户设置IPMI地址,通过IPMI查看到有P2的a1和b1内存报错,之后指导客户取下相关内存,设备开机还是会在grub界面重启。3,升级主板BIOS为最新版本,并重置BIOS,升级BMC为最新版本,并重置BMC,设备开机还是和之前情况一样。4,通过查看IPMI又有P2的c1和f1内存报错,之后指导客户将cpu2内存全部拔下,之后重启还是和之前情况一样,随后设备只留cpu1a1内存还是和之前情况一样。5,制作微PE镜像,开机选择windows镜像,发现还是会蓝屏,报错代码WHEA UNCORRE马文
20240124-17:40今日排查措施:1,再次更新BMC并重置,发现情况和之前一样,之后还是指导客户取下bios电池多放一会对设备进行放电,但操作完之后还是没有效果。2,制作windows系统安装盘,和客户沟通机械硬盘可以尝试用来安装windows系统进行测试,但在安装windows系统的时候还是会蓝屏,代码MACHINE CHECK EXCEPTION,又指导客户重新更换cpu1的单根内存,发现情况还是一样,3,指导客户取下固态硬盘,并再次取下BIOS电池进行放电,之后再次尝试安装系统,发现还是和之前一样蓝屏代码,ipmi提示:[CPU-0005] Configuration error - Assertion马文
20240305-17:00联系学生再次尝试,目前单根内存开机还是会重启,之后又尝试取下BIOS电池放电,随后通过远程设备ipmi重启尝试发现还是在系统界面会重启马文
20240312-11:00现场再次取下主板BIOS电池放电并安装一根内存开机尝试,情况和之前一样,还是到系统界面会重启,之后关机断电取下cpu2,开机发现正常进入系统,之后将cpu2单独放在cpu1位置发现设备还是不能正常点亮,之后更换带去的新的cpu,设备正常进入系统,内存全部正常识别,学生使用软件测试效率正常马文
20240313-11:00有问题的cpu2带回在公司使用测试过的主板进行内存单点也点不起来,更换了两根单独内存也是同样情况,目前已交给同事进行售后马文