处理时间 | 处理记录 | 处理人 |
---|---|---|
20241030-17:30 | 老师反馈节点2和节点3也存在命令不生效的问题,远程连接服务器排查02和03病毒,暂未发现病毒,但发现系统命令被替换,目前已帮助老师替换回来。老师测试可以正常运行,另外主节点任务已完成,老师重启了主节点之后远程对raid10报警的硬盘进行修复,目前已开始修复,修复状态正常 | 马文 |
20241018-18:00 | 远程帮助老师安装cuda12.4并写脚本标注cuda版本切换,安装gcc9.1.0 | 马文 |
20241029-12:00 | 老师反馈设备前几天通知要断电,但关机命令未生效,今天设备有报警声音出现,远程连接服务器排查,发现关机命令未生效是由于之前设备被病毒入侵,替换了相关系统命令,目前已帮助老师重新替换,另外发现raid卡有报警,排查发现有一块硬盘状态有问题,和之前报警的不是一块硬盘,尝试修复硬盘但还是会修复失败,报警faild,目前由于老师有任务在计算,告知老师等任务计算完成之后重启一下服务器在远程修复试试看 | 马文 |
20241031-17:30 | 远程查看raid修复状况,目前raid显示已修复完成,客户当前有任务在计算,等客户任务计算完成了再重启一次看看还会不会有报警情况 | 马文 |
20241106-12;00 | 昨日视频指导老师对设备关机放电,开机之后重新开始修复raid,今日检查发现raid卡管理软件里raid卡又掉线,目前客户有任务在计算,等计算完之后去现场检查处理 | 马文 |