硕星内部系统-技术部


广州大学 土木工程学院 刘超 2

序列号: SXSA000237112176
项目开始时间: 2023-06-16
项目结束时间: 20230718
目前状态: 已完成
业务姓名: 刘婷
联系电话: 15529078917
项目负责人: 田伊蕾

操作记录 增加
操作时间操作记录操作事故操作人
20230616-16:37Dell R750 8362/RTX8000田伊蕾
20230625-11:27快速服务代码:39009115155田伊蕾
20230625方案制作赵青
20230625 12:00检查dell硬件并拍照记录各个配件(马文帮我) cpu针脚异常,白主管已经修复,可以正常点亮刘建华
20230625 15:00安装Ubuntu22.04刘建华
20230625-18:00gputest测试RTX8000,时长1小时,GPU使用率均为百分之百,GPU1:73摄氏度;GPU1功耗:260W设备默认风扇转速测试GPU温度为八十三度左右,将风扇温控策略风扇便宜转速设置为中档,兼顾噪音与温度马文
20230625-18:05设备切换至独显输出没有反馈,之后联系戴尔中国,客服反馈RTX8000查询机器出厂也没有兼容支持这款显卡马文
20230626配件入库田伊蕾
20230625 18:06安装依赖包 nis ,rpcbind ,build-essential ,pbzip2 ,lm-sensors ,nfs-common ,tmux刘建华
2023.6.16合同制作,购销合同1张阿楠
20230627 11:54安装无线网卡,网络连接正常刘建华
20230628 09:00linpack测试(用时7小时)3614.2986; Gflops:236000Ns 温度:CPU1 70摄氏度左右 ,CPU2 72摄氏度左右刘建华
20230628-18:00设备更换硬盘安装win10操作系统测试,但设备蓝屏,蓝屏代码 CLOCK WATCHDOG TIMEOUT,查看相关代码指向CPU问题,但由于设备之前压力测试一切正常,尝试更换winserver系统,安装winserver2022发现设备还是相同报错,之后联系戴尔收集相关日志,日志显示有CPU 1 machine check error detected,并且两块cpu都有相关报错,上网查询解决方案,建议可以将设备放电尝试,随后进行放电操作也还是会蓝屏,之后根据戴尔官方建议安装winserver2019系统,但安装完成还是相同报错,随后将设备原有硬盘换回,设备重启之后出现了一次蓝屏马文
20230628-18:20并且在下班之前安装芯片组驱动的时候又蓝屏一次,还是之前报错,进idrac查看此次重启只是软件导致重启,并无硬件相关报错,随后将设备相关驱动安装完成,重新进行R23测试,测试正常,下班对设备进行windows下待机测试马文
20230629-9:40设备windows下待机测试失败,查看设备idrac日志,还是之前相关cpu报错,将情况向主管反馈,并继续排查测试,目前将改设备cpu取下安装在超微平台测试,并将8370C安装在戴尔设备进行测试马文
20230629-12:00该bios版本为1.10.2,官方最新版本马文
20230629-16:00将设备8362cpu安装至超平台16*16内存满插,win10系统进行R23以及分别使用fpu和内存测试两小时以上无异常,将设备切换至linux系统下进行vasp计算效率测试马文
20230629-18:00戴尔平台安装公司8370C设备进行测试,测试R23, windows下fpu以及内存各三小时以上均无异常,设备目前待机测试中马文
20230630-10:008370c在戴尔R750上windows下测试以及待机一小时,无异常,且idrac无异常,随后将8362换回至DELL项目,开机进windows系统有进行待机测试,但设备大约二十分钟又蓝屏重启,并且蓝屏代码和之前一样,idrac里报错信息也是一样马文
20230630-15:30设备安装windows1903系统尝试,但是设备安装完系统还是和之前情况一样蓝屏重启,并且idrac报错信息也和之前一样,目前已联系戴尔曼重新发送两颗8362测试,当前设备先切换到ubuntu系统下进行待机测试马文
20230703-9:50设备周末待机测试失败,查看idrac日志,还是显示和之前的报错信息,将设备更换换新的两颗8362cpu并清空之前的idrac重新进行测试观察马文
20230703-18:20设备windows下压力测试4小时,R23测试跑分六万一千多,之后待机到下班时长约7.5小时,一切正常马文
20230704-9:40设备更换新的8362之后经过压力测试以及待机测试到目前为止已超过20小时,现将设备切换至ubuntu系统下进行linpack测试马文
20230704-18:10截至下班设备linux下运行8.5小时,并完整跑完一组linpack测试 linpack:3597.2966 Gflops;236000Ns 温度:cpu1温度79摄氏度左右,cpu2温度81摄氏度左右,之后对设备进行第二轮linpack测试马文
20230705-10:00设备更换cpu之后windows下测试以及待机超过20小时无异常,切换至linux下进行两轮linpack测试无异常,之后将设备机械硬盘格式化挂载至/home目录下,随后对设备重启检查idrac日志,日志正常,无硬件相关报错,随即对设备开机进行待机测试,下午对设备再次进行linpack测试马文
20230705-18:20设备截至下班还在进行linpack测试,测试结果与温度均正常,目前还在进行测试中马文
20230711-11:00设备待机以及测试6天无异常马文
20230711设备包含显示器戴尔(U2722DX)和戴尔的PCIE无线网卡及导轨赵青
20230711 17:33硬件运行正常,输入、输出接口正常,系统进入正常,软件符合要求。王兆强
2023 0718 0930现场安装调试白劲松
2023.6.19整机采购张阿楠

售后记录
提交时间售后说明状态完成时间操作

配件列表
编号厂商型号SN数量领用人出库时间发票操作
17441DellR750HX50PW31赵青出库*
17470绿联扩展坞01赵青出库*
17475威讯USB外置声卡01赵青出库*
17650水星SG10512342Y10215101赵青出库*
17651其他16GU盘01赵青出库*
17688其他600*1000*60001赵青出库*
返回