处理时间 | 处理记录 | 处理人 |
---|---|---|
20210520-11:00 | 远程指导老师重新安装显卡驱动,安装完之后设备恢复正常,远程连接查看系统日志,并未发现异常,联系老师找一根网线通过IPMI查看报错,老师说下午有个会议,暂时弄不了了 ,明天继续跟进 | 马文 |
20210521-10:20 | 联系老师询问是否有时间,老师说暂时没有时间 可能到下周了 | 马文 |
20210603-16:00 | 联系老师,老师说今天还是不行,最近用着挺稳定的,先这样,后面有问题了联系我们 | 马文 |
20210617-22:00 | 现场沟通发现设备运行存在异常,设备重启后,需断电后才能正常启动设备;查看IPMI日志发现CPU报错;老师因为ubuntu本身的稳定性问题与我们沟通将系统更换为centos7;更换完成后,发现阵列盘无法挂载,需xfs_repair进行修复(在主管指导下了解该命令需谨慎使用,作为最后考虑选项),修复过程中,修复四次重启死机四次;与主管沟通后,目前怀疑可能与阵列卡有关;故后续先不调用阵列卡,让老师使用。老师表示理解; | 宋旭蒙 |
20210622-19:33 | 协助老师在centos7下安装向日葵,坚果云,cdo,hp打印机和扫描仪驱动,gcc10.2.0,百度网盘;设备今早又发生死机,目前让老师继续用,时刻查看内存状态; | 宋旭蒙 |
20210623-18:07 | 设备目前运行正常,继续跟进; | 宋旭蒙 |
20210701-11:00 | 老师反馈设备又发生重启,远程过程中设备反复重启三次以上,与主管沟通确认,由业务沟通联系老师设备发回; | 宋旭蒙 |
20210706-11:00 | 业务与老师确认,老师还有数据需要备份,备份后再联系发回; | 宋旭蒙 |
20210719-15:00 | 设备发回来之后收到快递首先对木架进行拍照,确认设备完好,拆开木架确认设备保修贴纸未被撕掉,拍照留存 | 马文 |
20210719-15:30 | 设备正常开机之后首先对设备进行linpack测试,测试二十分钟不到,设备死机,随后听从同事宋旭蒙建议将设备raid卡取下,随后再对设备进行linpack测试,目前测试正常 | 马文 |
20210722-17:00 | 目前设备在不装RAID卡的情况下测试3天没有问题,安装raid卡之后不超过20分钟设备就会死机,尝试网上给出的修复方法,均未修复好,更换raid卡之后也还是和之前一样的情况,目前已将情况反馈给主管,现在将设备两块硬盘取下进行测试,目前正在测试当中 | 马文 |
20210727-18:00 | 在同事宋旭蒙的提醒下得知由于河海大学周桂地老师设备之前是在ubuntu20.04系统下分区的,所以尝试在公司测试机上安装ubuntu20.04系统,之后设备硬盘修复完成,对数据进行压缩打包并暂时保存至服务器,然后将老师设备上之前的raid卡和硬盘安装回去,并对硬盘重新格式化,然后对设备继续进行linpack测试 | 马文 |
20210802-9:20 | 周末之后发现设备死机,关机之后需要将设备完全断电才能重启设备,和同事宋旭蒙沟通他之前也遇到过这种情况,向主管反馈之后,联系采购先发一块新的主板回来,目前暂时还是继续对设备进行测试 | 马文 |
20210813-10:30 | 将更换的主板安装到设备上继续测试,测试结果和之前一样,还是会死机,将设备进行单科cpu测试,设备依旧死机,更换公司备用4214cpu还是死机,更换内存之后测试七八小时没有问题,将设备之前用的cpu更换回去测试依旧死机 | 马文 |
20210813-17:40 | 个人猜测可能是由于小主板与raid卡兼容性可能不太稳定,将设备raid卡拆下对设备进行测试,截至下班前设备硬件设备测试没有问题 | 马文 |
20210816-10:00 | 设备测试接近3天,依旧没有问题,查看cpu2温度比较高,发现是由于cpu2散热风扇不工作,之后将设备关机,更换cpu2散热风扇供电,设备重新开机进行测试 | 马文 |
20210819-18:00 | 根据测试结果来看,得出结论可能是由于小主板和raid卡兼容性问题导致,向主管反馈了情况,和业务沟通最后确定给设备更换主板以及机箱 | 马文 |
20210820-14:00 | 给设备更换x11dai主板和614pc机箱,更换完之后对设备进行测试 | 马文 |
20210827-15:00 | 设备进行多轮linpack测试并待机,总共时长七天无异常,IPMI无异常,将设备打包发货 | 马文 |
20210901-17:00 | 远程协助老师进行设备拆箱并安装,之后老师开机正常使用 | 马文 |