Skip to content
  • 最新
  • 版块
  • 东岳流体
  • 随机看[请狂点我]
皮肤
  • Light
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • Dark
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
CFD中文网

CFD中文网

  1. CFD中文网
  2. OpenFOAM
  3. HPC节点独显效率

HPC节点独显效率

已定时 已固定 已锁定 已移动 OpenFOAM
22 帖子 5 发布者 14.8k 浏览
  • 从旧到新
  • 从新到旧
  • 最多赞同
回复
  • 在新帖中回复
登录后回复
此主题已被删除。只有拥有主题管理权限的用户可以查看。
  • C 离线
    C 离线
    cccrrryyy 超神
    在 中回复了 李东岳 最后由 编辑
    #13

    @李东岳 7H12那个,重新测了下:
    1节点 128核 7312s
    2节点 256核 3237s
    4节点 512核 1334s

    I don't want to survive, I want to thrive.

    李东岳李 C 2 条回复 最后回复
  • 李东岳李 在线
    李东岳李 在线
    李东岳 管理员
    在 中回复了 cccrrryyy 最后由 李东岳 编辑
    #14

    @cccrrryyy 不错啊,超线性!挺好挺好!

    1节点128核 7312s

    2节点128核 3372s

    4节点128核 1811s

    不过这个你跑的没问题?都是128核,4节点比1节点快了4倍?

    http://dyfluid.com/index.html
    需要帮助debug算例的看这个 https://cfd-china.com/topic/8018

    1 条回复 最后回复
  • C 离线
    C 离线
    cccrrryyy 超神
    在 中回复了 cccrrryyy 最后由 编辑
    #15

    @cccrrryyy 我再三确认过,因为我自己也觉得有点神奇了。

    我觉得保持总核数128不变的,和我之前测的那些差不多。多节点并行就是很快,节点独占的情况下相当于用4台机器的性能(L3缓存什么的)去支撑这个计算。

    所以保持总核数不变,和保持单节点的核数不变,有什么区别呀?从性价比来说,如果一定要节点独占,很明显我应该用4节点512核,更快,单价和4节点128核一样。

    I don't want to survive, I want to thrive.

    李东岳李 1 条回复 最后回复
  • 李东岳李 在线
    李东岳李 在线
    李东岳 管理员
    在 中回复了 cccrrryyy 最后由 编辑
    #16

    @cccrrryyy 这个帖子有点逐渐跑题了,我新搞一个帖子,挪过去之后大家讨论。

    http://dyfluid.com/index.html
    需要帮助debug算例的看这个 https://cfd-china.com/topic/8018

    1 条回复 最后回复
  • 李东岳李 在线
    李东岳李 在线
    李东岳 管理员
    写于 最后由 编辑
    #17

    @cccrrryyy 在 HPC节点独显效率 中说:

    1节点128核 7312s
    2节点128核 3372s
    4节点128核 1811s

    我这面主要想不明白的是这个数据。我的印象里:都是128核的情况下,4节点肯定是要比1节点要快,但不至于快4倍。也就快个不到2倍。L3缓存换成4倍也不至于快4倍哟。

    http://dyfluid.com/index.html
    需要帮助debug算例的看这个 https://cfd-china.com/topic/8018

    H 1 条回复 最后回复
  • H 离线
    H 离线
    heike256
    在 中回复了 李东岳 最后由 heike256 编辑
    #18

    @李东岳 网络带宽小于内存带宽的1/4可以出现这种情况,网络带宽制约非常明显的时候才能出现计算性能随节点数量线性scale-up的情况

    1 条回复 最后回复
  • L 离线
    L 离线
    luofq-sysu
    写于 最后由 编辑
    #19

    @李东岳 李老师,我在超算平台测试2000W算例,三节点并行64*3,计算两千步总耗时58s?!

    李东岳李 1 条回复 最后回复
  • 李东岳李 在线
    李东岳李 在线
    李东岳 管理员
    在 中回复了 luofq-sysu 最后由 编辑
    #20

    @luofq-sysu 应该不太可能的样子 ..

    http://dyfluid.com/index.html
    需要帮助debug算例的看这个 https://cfd-china.com/topic/8018

    L 1 条回复 最后回复
  • L 离线
    L 离线
    luofq-sysu
    在 中回复了 李东岳 最后由 编辑
    #21

    @李东岳 李老师,抱歉乌龙了,这个是超算支持工程师测试的,他应该重新blockMesh了。我自己亲手测试的结果是,3节点并行192核心,2000步总耗时——ExecutionTime = 2696.54 s ClockTime = 2758 s。

    贴一个CPU信息:Intel(R) Xeon(R) Platinum 8358P CPU @ 2.60GHz

    李东岳李 1 条回复 最后回复
  • 李东岳李 在线
    李东岳李 在线
    李东岳 管理员
    在 中回复了 luofq-sysu 最后由 编辑
    #22

    @luofq-sysu 这个靠谱 差不多 嗯

    http://dyfluid.com/index.html
    需要帮助debug算例的看这个 https://cfd-china.com/topic/8018

    1 条回复 最后回复

  • 登录

  • 登录或注册以进行搜索。
  • 第一个帖子
    最后一个帖子
0
  • 最新
  • 版块
  • 东岳流体
  • 随机看[请狂点我]