处理时间 | 处理记录 | 处理人 |
---|---|---|
20230718 | 测试发现长时间无法进入 重启后问题依旧 目前让学生node02独立于slurm进行测试; | 宋旭蒙 |
20230725 | 处理发现是日常读写量太大 无法满足需求 与主管沟通后建议学生上PBW级别的固态硬盘 | 宋旭蒙 |
20230807 | 协助学生将固态安装挂载到/tmp 目前正在测试; | 宋旭蒙 |
20230808 | 与学生确认设备目前运行正常 | 宋旭蒙 |
20230814 | 周六学生反馈 node06一提交作业 节点状态就为down 处理发现管理节点ntp服务没有正常启动 时间不同步 询问设备是否重启或关机过 学生反馈机房周五停电 问题已解决 node02节点状态正常 今日跟学生沟通学生还未回复 | 宋旭蒙 |
20230816 | 将节点并入集群 继续进行测试; | 宋旭蒙 |
2030821 | 设备目前运行正常 已联系业务沟通; | 宋旭蒙 |
20230907 | 合作伙伴现场给六台从节点加装固态 集群备份挂载后,运行正常 | 宋旭蒙 |