Skip to content
  • 最新
  • 版块
  • 东岳流体
  • 随机看[请狂点我]
皮肤
  • Light
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • Dark
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
CFD中文网

CFD中文网

  1. CFD中文网
  2. OpenFOAM
  3. HPC节点独显效率

HPC节点独显效率

已定时 已固定 已锁定 已移动 OpenFOAM
22 帖子 5 发布者 14.8k 浏览
  • 从旧到新
  • 从新到旧
  • 最多赞同
回复
  • 在新帖中回复
登录后回复
此主题已被删除。只有拥有主题管理权限的用户可以查看。
  • 李东岳李 在线
    李东岳李 在线
    李东岳 管理员
    写于 最后由 李东岳 编辑
    #1

    @cccrrryyy 跑个题,大佬有没有测试,你那面的云服务器跑这个算例,大约需要多少秒?这个算例openfoam10、9、2206都能跑

    http://dyfluid.com/standard.html#id1

    http://dyfluid.com/index.html
    需要帮助debug算例的看这个 https://cfd-china.com/topic/8018

    1 条回复 最后回复
  • C 离线
    C 离线
    cccrrryyy 超神
    写于 最后由 编辑
    #2

    @李东岳 给忘了- -我现在用的是2.3.1,6,和2006。这三个版本李老师有兴趣么?我下周跑几个看看

    I don't want to survive, I want to thrive.

    李东岳李 1 条回复 最后回复
  • 李东岳李 在线
    李东岳李 在线
    李东岳 管理员
    在 中回复了 cccrrryyy 最后由 编辑
    #3

    @cccrrryyy 我估计2006可能没问题。9以后的算例跟9之前的,会提示version不对,要康康康的一顿改加version,贼麻烦

    http://dyfluid.com/index.html
    需要帮助debug算例的看这个 https://cfd-china.com/topic/8018

    C 2 条回复 最后回复
  • C 离线
    C 离线
    cccrrryyy 超神
    在 中回复了 李东岳 最后由 编辑
    #4

    @李东岳 好,那我抽空跑个2006的试试。

    I don't want to survive, I want to thrive.

    1 条回复 最后回复
  • C 离线
    C 离线
    cccrrryyy 超神
    在 中回复了 李东岳 最后由 编辑
    #5

    @李东岳 2006也是一顿加version哈哈,我这边两款测的结果(2000步):
    EPYC 7H12 1节点128核 7312s
    EPYC 7532 1节点64核 7576s
    还有个7543的,据说是比7532快一点,有空我也试试看看。

    I don't want to survive, I want to thrive.

    李东岳李 1 条回复 最后回复
  • 李东岳李 在线
    李东岳李 在线
    李东岳 管理员
    在 中回复了 cccrrryyy 最后由 编辑
    #6

    @cccrrryyy 老铁你那面只有1个节点么?一个节点别跑了,我都不好意思麻烦老铁,这跑一个算例要跑2个多小时。。。

    http://dyfluid.com/index.html
    需要帮助debug算例的看这个 https://cfd-china.com/topic/8018

    C 1 条回复 最后回复
  • C 离线
    C 离线
    cccrrryyy 超神
    在 中回复了 李东岳 最后由 编辑
    #7

    @李东岳 我看李老师你列的几个主要是单节点的速度。多节点的话,是不是需要保证没有其他作业,就是节点独占?

    I don't want to survive, I want to thrive.

    李东岳李 1 条回复 最后回复
  • 李东岳李 在线
    李东岳李 在线
    李东岳 管理员
    在 中回复了 cccrrryyy 最后由 编辑
    #8

    @cccrrryyy 是,跑节点的话,要保证节点独占,是不是你们不太好跑。不好跑就算了。

    http://dyfluid.com/index.html
    需要帮助debug算例的看这个 https://cfd-china.com/topic/8018

    C 2 条回复 最后回复
  • C 离线
    C 离线
    cccrrryyy 超神
    在 中回复了 李东岳 最后由 编辑
    #9

    @李东岳 调度系统应该有命令可以实现这个,不过这个和我们的实际应用场景不符合的。我测测不同节点数情况下的加速比看看,对这个也听感兴趣的。

    I don't want to survive, I want to thrive.

    1 条回复 最后回复
  • C 离线
    C 离线
    cccrrryyy 超神
    在 中回复了 李东岳 最后由 编辑
    #10

    @李东岳 测了下7H12那个,都是节点独占:
    1节点128核 7312s
    2节点128核 3372s
    4节点128核 1811s
    这个加速效果可以啊

    I don't want to survive, I want to thrive.

    李东岳李 1 条回复 最后回复
  • 李东岳李 在线
    李东岳李 在线
    李东岳 管理员
    在 中回复了 cccrrryyy 最后由 编辑
    #11

    @cccrrryyy 4节点256核吧?
    可以,线性,达标

    http://dyfluid.com/index.html
    需要帮助debug算例的看这个 https://cfd-china.com/topic/8018

    C 2 条回复 最后回复
  • C 离线
    C 离线
    cccrrryyy 超神
    在 中回复了 李东岳 最后由 编辑
    #12

    @李东岳 不是,总核数都是128核。这种测试应该是保持核数不变还是单节点核数不变?

    你说的这种我再测测。

    I don't want to survive, I want to thrive.

    1 条回复 最后回复
  • C 离线
    C 离线
    cccrrryyy 超神
    在 中回复了 李东岳 最后由 编辑
    #13

    @李东岳 7H12那个,重新测了下:
    1节点 128核 7312s
    2节点 256核 3237s
    4节点 512核 1334s

    I don't want to survive, I want to thrive.

    李东岳李 C 2 条回复 最后回复
  • 李东岳李 在线
    李东岳李 在线
    李东岳 管理员
    在 中回复了 cccrrryyy 最后由 李东岳 编辑
    #14

    @cccrrryyy 不错啊,超线性!挺好挺好!

    1节点128核 7312s

    2节点128核 3372s

    4节点128核 1811s

    不过这个你跑的没问题?都是128核,4节点比1节点快了4倍?

    http://dyfluid.com/index.html
    需要帮助debug算例的看这个 https://cfd-china.com/topic/8018

    1 条回复 最后回复
  • C 离线
    C 离线
    cccrrryyy 超神
    在 中回复了 cccrrryyy 最后由 编辑
    #15

    @cccrrryyy 我再三确认过,因为我自己也觉得有点神奇了。

    我觉得保持总核数128不变的,和我之前测的那些差不多。多节点并行就是很快,节点独占的情况下相当于用4台机器的性能(L3缓存什么的)去支撑这个计算。

    所以保持总核数不变,和保持单节点的核数不变,有什么区别呀?从性价比来说,如果一定要节点独占,很明显我应该用4节点512核,更快,单价和4节点128核一样。

    I don't want to survive, I want to thrive.

    李东岳李 1 条回复 最后回复
  • 李东岳李 在线
    李东岳李 在线
    李东岳 管理员
    在 中回复了 cccrrryyy 最后由 编辑
    #16

    @cccrrryyy 这个帖子有点逐渐跑题了,我新搞一个帖子,挪过去之后大家讨论。

    http://dyfluid.com/index.html
    需要帮助debug算例的看这个 https://cfd-china.com/topic/8018

    1 条回复 最后回复
  • 李东岳李 在线
    李东岳李 在线
    李东岳 管理员
    写于 最后由 编辑
    #17

    @cccrrryyy 在 HPC节点独显效率 中说:

    1节点128核 7312s
    2节点128核 3372s
    4节点128核 1811s

    我这面主要想不明白的是这个数据。我的印象里:都是128核的情况下,4节点肯定是要比1节点要快,但不至于快4倍。也就快个不到2倍。L3缓存换成4倍也不至于快4倍哟。

    http://dyfluid.com/index.html
    需要帮助debug算例的看这个 https://cfd-china.com/topic/8018

    H 1 条回复 最后回复
  • H 离线
    H 离线
    heike256
    在 中回复了 李东岳 最后由 heike256 编辑
    #18

    @李东岳 网络带宽小于内存带宽的1/4可以出现这种情况,网络带宽制约非常明显的时候才能出现计算性能随节点数量线性scale-up的情况

    1 条回复 最后回复
  • L 离线
    L 离线
    luofq-sysu
    写于 最后由 编辑
    #19

    @李东岳 李老师,我在超算平台测试2000W算例,三节点并行64*3,计算两千步总耗时58s?!

    李东岳李 1 条回复 最后回复
  • 李东岳李 在线
    李东岳李 在线
    李东岳 管理员
    在 中回复了 luofq-sysu 最后由 编辑
    #20

    @luofq-sysu 应该不太可能的样子 ..

    http://dyfluid.com/index.html
    需要帮助debug算例的看这个 https://cfd-china.com/topic/8018

    L 1 条回复 最后回复

  • 登录

  • 登录或注册以进行搜索。
  • 第一个帖子
    最后一个帖子
0
  • 最新
  • 版块
  • 东岳流体
  • 随机看[请狂点我]