Skip to content
  • 最新
  • Categories
  • 东岳流体
  • 随机看[请狂点我]
Skins
  • Light
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • Dark
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • Default (No Skin)
  • No Skin
Collapse
CFD中文网

CFD中文网

  1. CFD中文网
  2. Algorithm
  3. GPU VS CPU

GPU VS CPU

Scheduled Pinned Locked Moved Algorithm
7 Posts 5 Posters 12.1k Views
  • Oldest to Newest
  • Newest to Oldest
  • Most Votes
Reply
  • Reply as topic
Log in to reply
This topic has been deleted. Only users with topic management privileges can see it.
  • 李东岳李 Offline
    李东岳李 Offline
    李东岳 管理员
    wrote on last edited by
    #1

    GPU加速计算这个概念已经很久了并且很多人也用在了CFD上,但是主流CFD求解器还是没有完全的支持。

    ANSYS Discovery Live这个革命性的产品使用GPU来进行计算,是否会推广GPU的应用?大家对GPU计算有什么经验可以共享么?

    9月CFD算法编程课: http://dyfluid.com/class.html

    需要帮助debug算例的看这个 https://cfd-china.com/topic/8018

    一 1 Reply Last reply
  • 一 Offline
    一 Offline
    一二
    replied to 李东岳 on last edited by
    #2

    @李东岳 普通的显卡作为GPU的话算直接的浮点运算效率回高很多,LES的求解器很多时间步长很小,可以直接进行时间推进,这种算起来就快,还有波尔兹曼方法,也是显式的时间推进方法。这种情况下一个GTX1080显卡,计算速度比7700k的cpu跑起来快100倍。看过固体力学也有算这类问题的,他们说能快到200倍。
    但是如果用SIMPLE算法这种需要迭代循环的,还有求解压力伯松方程要算方程组问题的,会跑得非常慢。我朋友测试过大概1080就比普通的7700k快个一两倍。集群上的E5 E7这种核心比较多对比的话那么单纯用GPU似乎没有什么优势了,毕竟一个1080也不便宜。
    不过苹果最早开发了新的架构,把浮点运算交给GPU把逻辑运算交给CPU,这种计算速度就特别快。现在超算中心好多都配置了这种加速卡。无锡太湖之光的也是用这种思路进行计算的。
    但总体来说还是觉得编程上太困难了,我听天河中心的专家说现在CFD计算用加速卡的好像不多。

    1 Reply Last reply
  • 程 Offline
    程 Offline
    程迪
    wrote on last edited by
    #3

    感觉GPU只是另一个层次和规模的并行计算,而并行计算的问题本质上还是算法的数据依赖问题,不管是Cache命中率还是显式隐式算法的问题其实都可以归结到数据依赖。

    再放长远一些,到exa-scale之后内存效率反而是最重要的,GPU的内存和计算核心间的物理距离一般比CPU到主存要小,今后可以提高的空间会更多。

    已婚,勿扰。
    本作品采用知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议进行许可。

    1 Reply Last reply
  • 李东岳李 Offline
    李东岳李 Offline
    李东岳 管理员
    wrote on last edited by
    #4

    @一二 显式时间推进?确认一下,你是说欧拉显性求解NS方程构成的对角阵用GPU求解效率非常大?

    @程迪

    GPU的内存和计算核心间的物理距离一般比CPU到主存要小

    ...,
    硬件上的距离么..

    9月CFD算法编程课: http://dyfluid.com/class.html

    需要帮助debug算例的看这个 https://cfd-china.com/topic/8018

    程 1 Reply Last reply
  • 程 Offline
    程 Offline
    程迪
    replied to 李东岳 on last edited by
    #5

    @李东岳
    嗯,铜导线距离。3GHz时每个时钟周期电场才走了10cm.你看看内存到cpu的距离?

    显式的数据依赖太明显了,把要用的往cache一送,搞定,cache离核心特别近。隐式的得回头修改这个自由度那个自由度,好麻烦。

    网上好多视频讲未来exa-scale的计算,反正最后内存和容错是最大的限制。总核数上去了,移动数据相对于计算数据来说会特别慢,单个核可靠性不变的话整体可靠性也随着核数增加急剧下降。

    已婚,勿扰。
    本作品采用知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议进行许可。

    MicroM 1 Reply Last reply
  • L Offline
    L Offline
    LiuSW
    wrote on last edited by
    #6

    GPU的双精度浮点运算能力是要落后与单精度运算的,所以在CFD求解的时候,部分运算可以在GPU上使用单精度运算实现更大的加速比。在LES计算中,哪些部分可以使用这种快速策略,而不影响整体计算结果呢?@一二

    1 Reply Last reply
  • MicroM Offline
    MicroM Offline
    Micro
    replied to 程迪 on last edited by
    #7

    @程迪 在 GPU VS CPU 中说:

    隐式的得回头修改这个自由度那个自由度

    你好,请问您所说的自由度是什么意思,能够稍微解释一二,不胜感激,谢谢!

    1 Reply Last reply

  • Login

  • Login or register to search.
  • First post
    Last post
0
  • 最新
  • Categories
  • 东岳流体
  • 随机看[请狂点我]