处理时间 | 处理记录 | 处理人 |
---|---|---|
20240614 | 7T的U.2固态有一块掉盘了,目前重启还是不识别,已经注释挂载了,让他们先计算 | 宋旭蒙 |
20240808 | 集群卡顿,效率,计算节点top只有百分十五十,可用内存仅有不到2G 使用 echo 3 > /proc/sys/vm/drop_caches echo 2 > /proc/sys/vm/drop_caches echo 1 > /proc/sys/vm/drop_caches 清空后问题依旧,取消所有作业后正常,目前仅开放了6个计算节点使用,目前正常 | 宋旭蒙 |
20240809 | 当前节点数效率正常,下周一继续跟进 | 宋旭蒙 |
20240812 | 02-07节点重启后运行到现在,效率正常,目前开启08-09测试,如若运行正常,告知客户,在一个周期的计算结束后,重启下集群 | 宋旭蒙 |
20240815 | 设备目前8个节点运行正常;集群昨天断电了,今天有几个节点没有上线,目前全部上线 | 宋旭蒙 |
20240816 | 目前节点全部上线运行正常; | 宋旭蒙 |
20241127 | 现阶段两块固态硬盘,已经满足需求,空闲的两块,后续添加其它节点 | 宋旭蒙 |