处理时间 | 处理记录 | 处理人 |
---|---|---|
20221014-11:00 | 和老师联系后了解到设备又远程连接不上了,到机房发现设备闪黄色指示灯,老师将设备关机之后对设备进行放电操作,之后进去设备idrac查看到有一条cpu1 machine check error detected的报错提示,之后上网查看可能是由于bios版本问题所致,当前BIOS版本为2.14.2,最新BIOS版本为2.15.1,目前先告知老师将设备完全放电之后先计算看看,如果还是不行的话我们尝试升级一下BIOS | 马文 |
20221017-14:00 | 老师反馈周末自己已经升级了最新的BIOS,但是昨天提交的VASP任务今天早上又断掉了,重新练级之后发现任务断了但是系统是正常的,目前老师强烈要求需要戴尔技术介入处理,下午联系戴尔官方技术,戴尔方面联系老师首先收集IDRAC日志,后续处理事宜持续跟进 | 马文 |
20221017-17:50 | 询问老师目前戴尔有没有给出解决方案,老师暂时未回复 | 马文 |
20221019-11:00 | 联系老师询问和戴尔的沟通进展,老师反馈昨天关掉了CPU节能模式,下午提交了任务,晚上那个任务又断掉了,但是没有出错的log记录,老师下午再测试下,再有问题老师先联系厦门那边。老师反馈戴尔方面表示如果有出错可能需要更换主板,目前先等老师测试结果 | 马文 |
20221021-17:00 | 下午三点询问老师目前和戴尔方面沟通情况,截至五点老师暂未回复 | 马文 |
20221026-16:40 | 老师反馈昨晚cpu又出现了一次报错,我也向戴尔反馈了,按照这个官网的回复,如果经过更改cpu节能,换主板解决不了,最后只能换一个机器,目前老师已经将收集的日志发送给戴尔,暂时等候戴尔方面回复 | 马文 |
20221027-16:00 | 中午戴尔方面以及老师进行三方通话,戴尔方面目前表示通过日志判断我们有一颗cpu有问题,并且设备可能需要更换主板,希望我们尽快可以发一颗新的CPU过去,目前老师表示又一次将最新的日志收集之后发给了戴尔,暂时先等戴尔回复 | 马文 |
20221101-16:50 | 老师和业务通话,之后大概说明了戴尔方面反馈需要更换主板的情况,并且我们坚定立场,首先要求戴尔方面更换主板,目前老师反馈次日十点左右会和戴尔进行三方通话进行最终方案确定 | 马文 |
20221102-10:30 | 十点和老师还有戴尔方面进行三方通话,目前表面我们坚持需要他们更换主板,并叮嘱戴尔方面更换主板之后升级BIOS至最新版本 | 马文 |
20221103-17:50 | 和老师确认目前戴尔方面已将主板更换,更换完成之后设备内存和CPU识别正常,目前老师自己重新安装了源码centos,告知老师可以先安装vasp计算这几天观察看看 | 马文 |
20221107-15:20 | 询问老师设备更换主板之后计算有没有问题。老师反馈周末待机测试了两台,今天开始在装软件 | 马文 |
20221110-16:30 | 询问老师更换完主板之后设备有没有再出现过问题,老师反馈从7号开始提交的任务到现在为止计算一切正常,且有已计算完成的任务,效率也都正常 | 马文 |
20221116-11:00 | 询问老师最近这几天设备运行是否正常,算例是否正常计算,老师反馈目前为止一切都正常,之后向主管反馈当前情况,主管指示下周再跟进一下,没问题就可以 | 马文 |
20221123-10:00 | 再次和老师联系询问设备运行情况,老师反馈设备运行正常,算例也都正常运行正常 | 马文 |