200万网格并行算力测试(OpenFOAM版本)
-
CPU型号:1135G7 系统:Ubuntu 22.04.2 LTS OpenFOAM版本:OpenFOAM-10 4 766.951 2 687.98 1 897.375
-
CPU型号:AMD EPYC 7302 (2)
系统:Ubuntu 20.04 LTS
OpenFOAM版本: OpenFOAM-v1906
32 77.91
16 104.34
8 142.72
4 273.18
2 528.45
1 1128.94 -
龙芯平台的测试数据,以供参考。
CPU型号:Loongson-3A5000LL 系统:Loongnix GNU/Linux 20 (DaoXiangHu) 内核:Linux 4.19.0-19-loongson-3 (loongarch64) OpenFOAM版本:OpenFOAM-v2206 4 902.14 2 1172.93 1 1993.66
linux内核 6.0版本之后会有原生的loongarch架构支持,等搞定系统以后再测一版。
-
-
@文昌鱼 这个好!!!
-
CPU型号:AMD EPYC 7763 64-Core (双路)
系统:ubuntu18.04
内存:256G ddr4
OpenFOAM版本:OpenFOAM v2006
128 125.5
64 105.71
32 109.28
16 124.35
8 171.75
4 276.83
2 517.43
1 887.79超线程已关,结果不怎么样,难不成我这个是假7763?请问如何优化?(刚组的机器,没多长时间)
-
@CFDngu 我在想是不是这个多少核的加速比最大和网格数量也有关。感觉是这个网格数量下,80核恰好能用满内存带宽。之前东岳兄提到过单路32核最快,会不会也是测试的网格数量某种程度恰好吃满内存带宽了,所以单个刀片加核数就卡在通讯那儿了……
-
我测试3200万、800万网格,32核以上非常不线性。64核相对32核的性能提升基本就是个1.2倍。远远达不到2倍。这种intranode的scale就是这样了。64核的机器还可以64核最快。超过64核的机器,基本就是80核最快了。另外那个128核心的7742,性能还不如核心少的7502,这个U我都觉得烫手,测试完了1天就退回供应商了。epyc3代相对还好。但毕竟有老铁买,我不好评价。在epyc4代的型号,这个问题也很严重。一些大教授不差钱一窝蜂的上epyc4代256核的机器,后来实测160核性能最强。然后windows-fluent彻底卡死,epyc3代算3分钟的,windows-fluent上epyc4代要卡3小时。所以我认为多核心的机器,机架式是最终解决方案。
最完美的就是单机32核甚至28核,然后8个节点做到256核。这个性能非常强。远超单机256核数倍。
153/223