处理时间 | 处理记录 | 处理人 |
---|---|---|
20240820-17:30 | 客户在群聊西北2361反馈node05掉线了,随后联系客户远程查看发node05用ssh连不上,也ping不通05的ip,随后让学生重启05,但还是没反应,之后让学生将05断电,拔掉电源线之后长按45秒以上开机键对设备进行放电,到第二天再接电开机 | 马文 |
20240821-18:00 | 联系客户再次重启设备,但设备还是重启不起来,键鼠无反馈,和学生约到第二天去现场检查处理 | 马文 |
20240822-19:00 | 现场将设备取下重新插拔内存,发现还是进不去系统,bios也进不去,随后取掉内存只剩A1和B1内存设备可以进bios和idrac,idrac报错CPU 1 MEMABCD VPP PG voltage is outside of range.上网查看有可能是内存引起的报错,随后两根两根加内存,尝试加到四根以上就不行,进不了idrac,怀疑是主板问题,现场向主管和客户反馈之后将设备拉回公司进行排查 | 马文 |
20240823-18:00 | 到公司调查idrac后台,再多加了几根内存显示a5和b5内存显示检测到非常严重错误,之后将a5和b5内存更换到a1和b1内存位置,之后开机进idrac还是显示a5和b5内存显示检测到非常严重错误,随后联系戴尔售后,协助抓取idrac日志上传给戴尔,戴尔判断主板有问题,已预约下周一上门更换主板 | 马文 |
20240826-17:50 | 经测试售后带过来的主板可能还是有问题,第一是主板更换之后BIOS和idrac信息未回写成功,第二还是会报之前内存电压错误,之后尝试两根两根加内存,插了a1a2a3和b1b2b3,进bios之后只识别64G内存,idrac显示a2和b2内存报错,将a2和b2内存更换至a1和b1位置之后重启更新还是会报a2和b2内存错误,目前已收集最新的日志发送给戴尔工程师,待后续处理 | 马文 |
20240826-19:20 | 经配件测试确定是之前的一根镁光内存有问题导致idrac报错,目前暂时给dell设备安装了16跟32G三星内存,全部正常识别,设备目前待机测试 | 马文 |
20240827-12:00 | 目前将dell之前内存装回进行稳定性测试,cpu2温度稍微有点高,之后将cpu2更换至cpu1位置,并重新涂抹硅脂,调试风扇策略,目前测试温度稳定在70度左右,截至下班已测试两轮linpack,测试稳定 | 马文 |
20240829-18:00 | 目前已更换内存,总内存256G,已测试两轮linpack,温度正常,结果正常 | 马文 |
20240830-17:00 | 和业务一同去现场将设备上架并调试所有戴尔设备散热策略,目前所有设备满载运行温度不超过七十度 | 马文 |