可以使用profiling tool 去查程序的某个部分有问题。
简单的intel vtune, intel advisor。
这个需要你有一些基础的performance engineering的知识。
可以在网上找找关键词,MPI tracer, roofline model, performance engineering。
这还涉及到MPI的知识。可以找一下关于MPI的课,不过MPI在OF中基本被各种隐藏,一般情况下可能你也看不到什么。不过我记得有关于mesh的renumbering的操作,在大规模并行的时候,会有一些优化。 当然这个也要看你使用的是什么计算,网格怎么分配的~