Your browser does not seem to support JavaScript. As a result, your viewing experience will be diminished, and you have been placed in read-only mode.
Please download a browser that supports JavaScript, or enable it if it's disabled (i.e. NoScript).
大家好,我在计算时遇到了一个问题,机器是一个双路的 AMD 128核服务器,内存为256G。并行测试时,48核可以计算,但是72核和96核在计算的时候就会自动关机。对机器进行stress 压力测试,96核测试半个小时也没问题,但是一运行openfoam的96核并行就出问题。测试算例包括李东岳的2000W网格测试算例和自带的 DTUHullMoving 算例,我不知道这到底是硬件问题还是其他的什么问题,急着开始算东西,有了解的大佬可以告诉我什么原因吗。
机器的高负载应用只有OpenFOAM吗? 试试其他软件(如FLUENT)的高负载情况看会不会关机? 或者换一个版本的OpenFOAM? 压力测试应该是指FPU烤机吧? 可能还得测试一下内存读写高负载是否崩溃导致关机.
硬件的话首先考虑电源功率是否足够以及实验室电压稳不稳,其次考虑内存条有没有插牢
自动关机、重启类似的问题都需要找硬件供应商。
确定是“自动关机”而不是“自动重启”?如果只是自动重启,兴许只是内存满了,把GUI撑爆了,GUI自动重启了。
如果确定是自动关机的故障就别开机了。自动关机的时候估计哪里电流过载之类的,多冲几次就成永久故障了。
@Amadeus 好的
@李东岳 谢谢李老师,联系卖的人了 @bestucan 老师,我写错了,是自动重启了,不是自动关机了。内存是256G,测试的网格是八十多万感觉不应该把内存爆了,因为测试96核和72核自动重启,但是对56核就没问题,单个CPU是64核的