硕星内部系统-技术部


海南大学耿文通1   售后提交时间: 20221017  售后完成时间: 2022.10.19-14:07:36    打印


目前状态: 完成
负责业务: 孙春香
负责技术: 宋旭蒙
业务电话: 18710866736
客户联系方式:
学生微信:loveweotao
售后情况:
学生反馈集群中Node03&04计算比01&02慢,相同算例01&02一个计算步8秒,而03&04一个计算步需要38秒

处理记录   
处理时间处理记录处理人
20221017通过top发现算例计算过程中 01&02的sy仅有6.x 而 03&04的sy有26.x 1.首先排查slurm的问题 让算例均独立于slurm 终端提交计算 问题依旧; 2.因为问题依旧推测跟slurm无关,因为04用的是nis和nfs故将04设备nis&nfs断开独立出来进行计算,计算效率正常;目前推测是万兆带宽问题; 3.测试发现万兆网卡仅能带起两台 ,目前将03 04独立出来 同步用户软件和配置slurm 宋旭蒙
202210181.给03&04 同步用户和程序,因为仅有Node01有外网,故在/data下给不同的用户创建文件夹和软链 方便传输 测试正常; 2.学生联系说不小心rm -rf ~ 导致数据丢失 告知学生目前只能恢复环境变量 数据无法恢复了 学生表示理解 恢复完成后 告知学生后续要即使备份;宋旭蒙