硕星内部系统-技术部


清源创新实验室赵芮1   售后提交时间: 23.7.31  售后完成时间: 2023.08.23-18:14:47    打印


目前状态: 完成
负责业务: 刘婷
负责技术: 马文
业务电话: 15529078917
客户联系方式:
赵芮17745162499
售后情况:
主节点异常死机

处理记录   
处理时间处理记录处理人
20230731-18:00客户反馈设备远程连不上,去机房发现设备处于关机状态,按开机键没有反应,之后指导客户拔掉电源线之后多按几次开机键放电操作,之后开机可以正常开机,开机之后对设备进行满载测试并观测内存状态以及温度,并查看设备系统日志暂未发现异常,设备满载测试半小时左右又连不上,按开机键还是没反应,之后再次进行放电操作,指导学生配置ipmi,之后通过ipmi查看暂时也没有硬件相关报错,随即清空ipmi,学生反馈电脑没电了,暂时告知学生先提交任务计算,待周三远程继续排查问题马文
20230802-12:00目前尝试过主板BIOS电池放电以及更换过BIOS电池 但是都是开机测试一会就关机了 而且还是必须要把电源线拔掉重新插才能正常开机,并且查看系统日志以及IPMI没有硬件报错信息马文
20230802-17:00将情况向主管反馈,目前怀疑可能是主板或者是电源问题,主管指示先安排更换个电源试试看,联系同事购买电源,目前显示明日到,已经和老师沟通好明日收到电源之后联系并指导学生更换电源进行测试马文
20230803-16:00学生收到电源指导学生先拆卸旧的电源,目前发现之前的cpu供电线和cpu供电插口有烧焦痕迹,学生表示自己不敢操作了,也将情况向主管进行反馈,目前暂定方案是给客户协调出来两台设备客户先远程使用,我们后续会安排人过去上门处理马文
20230804-17:00安排刘建华和王兆强生产两台测试机,并安装centos打包系统 组件集群,安装oneapi,编译vasp6.1.0 ,vaspkit ,g09,之后联系客户测试,目前客户已在远程使用中马文
20230808-16:40和客户沟通目前会尽快安排人过去现场处理,客户表示两台机器目前不够,目前又重新加了一个从节点进去,目前一共三台设备协调给客户使用中马文
20230809-11:00当地找技术人员上门处理,发现主板上cpu供电接口处烧毁痕迹较重,无法清理,将情况向主管反馈后联系上门技术人员将主板取下连同坏的电源一起给我们寄回来,并且告知需要仔细包装,填充好空隙马文
20230817-17:00同事王恺华测试客户寄回主板: 旧主板无法将cpu供电接口清理干净,更换主板并安装显卡,将系统中/etc/rc.local中挂载的硬盘注释掉,进入系统,测试linpick7小时左右,ipmi无报错;周末待机两天,设备正常,ipmi无报错马文
20230818-11:00再次检查硬件情况并多次重启,目前寄回的硬件均正常,已联系老师告知设备今日发出,老师收到之后及时联系我们马文
20230821-10:20远程指导当地技术人员上门安装主板并接线,之后视频指导学生设置网络,随后设备开机硬件识别正常,集群工作正常马文
20230822-18:00联系老师询问设备运行情况。老师反馈设备一切正常,该售后处理完成马文