处理时间 | 处理记录 | 处理人 |
---|---|---|
20221017 | 通过top发现算例计算过程中 01&02的sy仅有6.x 而 03&04的sy有26.x 1.首先排查slurm的问题 让算例均独立于slurm 终端提交计算 问题依旧; 2.因为问题依旧推测跟slurm无关,因为04用的是nis和nfs故将04设备nis&nfs断开独立出来进行计算,计算效率正常;目前推测是万兆带宽问题; 3.测试发现万兆网卡仅能带起两台 ,目前将03 04独立出来 同步用户软件和配置slurm | 宋旭蒙 |
20221018 | 1.给03&04 同步用户和程序,因为仅有Node01有外网,故在/data下给不同的用户创建文件夹和软链 方便传输 测试正常; 2.学生联系说不小心rm -rf ~ 导致数据丢失 告知学生目前只能恢复环境变量 数据无法恢复了 学生表示理解 恢复完成后 告知学生后续要即使备份; | 宋旭蒙 |