Title: 並列CFD計算における非同期通信-計算重複法
Authors: 黒川, 原佳
松澤, 照男
姫野, 龍太郎
重谷, 隆之
Issue Date: 2001-08-15
Publisher: 情報処理学会
Magazine name: 情報処理学会論文誌 : ハイパフォーマンスコンピューティングシステム
Volume: 42
Number: SIG9(HPS3)
Start page: 54
End page: 63
Abstract: 大規模なComputational Fluid Dynamics(CFD)計算を実用時間内に行うために, 並列計算の必要性はきわめて高い.並列CFD計算は, 計算時間と同時に通信時間を費やす.そのため, 通信性能の低い分散メモリ型並列計算機上で流体計算を効率良く行うには, データ通信処理の方法が重要である.効率的な通信処理方法の1つは, 通信処理を計算処理で隠蔽し, 通信処理時間を擬似的に短くする通信隠蔽処理法がある.通信隠蔽処理法には, パイプライン処理法と非同期通信-計算重複法がある.本研究では, 領域分割法を用いたMaker And Cell(MAC)法の並列CFD計算に, 非同期通信-計算重複法による通信隠蔽を適用して並列計算を行った.また, 領域の分割パターンは, 最も並列計算効率の高いものを用いた.そして, 非同期通信-計算重複法の適用による総経過時間への効果を検討した.非同期通信-計算重複法の適用において, PE数が少ない場合, 非同期通信の待ち処理(MPI_-Wait)時間は, 総経過時間に対して無視できない長さだった.しかし, PE数の増加に応じて待ち処理時間は短くなった.待ち処理時間は, 通信データ量に依存した.また, 非常に小さな問題サイズで非同期通信-計算重複を行った場合にも過剰な性能飽和は見られなかった.通信隠蔽を行わないCFDの実装方法に比べ, 非同期通信-計算重複法を適法した場合の速度向上比は, RS/6000 SPで最大14%程度, PCクラスタで最大31%程度向上した. : A parallel computation for a large-scale Computational Fluid Dynamics(CFD) simulation is important for the real-world simulations. A parallel CFD computation time consists of the computation time and the communication time. The communication processing is important to compute CFD efficiently on a distributed memory based parallel computer with low-speed communication system. The overlapping of communication with computation is a method of pseudo-shortening communication time. The overlapping of communication with computation by the pipeline method and the systolic communication-computation overlap method. In this research, we executed the parallel CFD simulation by the Maker And Cell(MAC) method and the domain decomposition method using the systolic communication-computation overlap. We used a most efficient partitioning pattern for the domain decomposition. We discussed the effect of the systolic communication-computation overlap for a parallel CFD on a total elapsed time. In result, W ait processing(MPI_-Wait)of the asynchronous communication using the systolic communication-computation overlap by a few number of PE had an elapsed time, which was not able to be disregarded. However, the elapsed time of W ait processing became short when the number of PE increased. The elapsed time of W ait processing depended on the amount of the data communication. The elapsed time of the systolic communication-computation overlap does not have excessive performance saturation on the very small problem size. We show the speed up ratio of the RC
Rights: 社団法人 情報処理学会, 黒川原佳、松澤照男、姫野龍太郎、重谷隆之, 情報処理学会論文誌 : ハイパフォーマンスコンピューティングシステム, 42(SIG9(HPS3)), 2001, 54-63. ここに掲載した著作物の利用に関する注意: 本著作物の著作権は(社)情報処理学会に帰属します。本著作物は著作権者である情報処理学会の許可のもとに掲載するものです。ご利用に当たっては「著作権法」ならびに「情報処理学会倫理綱領」に従うことをお願いいたします。 Notice for the use of this material: The copyright of this material is retained by the Information Processing Society of Japan (IPSJ). This material is published on this web site with the agreement of the author (s) and the IPSJ. Please be complied with Copyright Law of Japan and the Code of Ethics of the IPSJ if any users wish to reproduce, make derivative work, distribute or make available to the public any part or whole thereof. All Rights Reserved, Copyright (C) Information Processing Society of Japan.
