关于并行计算的问题
-
@CFDngu 请问有没有什么规则来决定应该分多少块?是不是四核就只能分4块?还是说分的越多越好?
-
@xiaofenger
标准的并行程序做法应该是有多少numa块,分成多少块。考虑OpenFOAM一般没有开启OpenMP,有多少核分多少块吧。
-
@xpqiu
https://www.cfd-online.com/Forums/openfoam/191055-why-renumbering-works-ldumatrix.html#post658931
Jasaki 说是因为增加了cache命中率,固定点迭代也改善了单元周围update的单元。 -
@程迪 我在四核八线程的电脑上装了virtualbox, 然后给Ubuntu虚拟机分了2个CPU,这样应该decompose成两块?只分成两块会比一整块有大的速率提升吗?
-
分两块,应该有大的提升。
-
如果是带状的diag band结构,renumber增加效率是合理的。但是ldu不应该呀。
在Numerical Recipes in C++上面有提及部分矩阵reordering和并行技术,Yoosf Saad那本稀疏线性系统有大量的论述,目前暂时了解不是很深如。不过我确定对于非结构网格离散后的矩阵不一定是比较窄的带状的。并且reNumberMesh是在分配矩阵操作之前。可以理解为对某些网格导致比较宽的离散矩阵进行预先操作,降低带宽。具体降低带宽后如何提高迭代求解还得看资料。
2017年7月27日 12:38
16/17
2017年7月31日 22:25