解析事例

個別要素法の計算高速化

1. はじめに

個別要素法は,個々の粒子(要素)に作用する力から,粒子群の運動を陽解法を用いて追跡していくため,解析時間がかかるという問題があり,また個別要素法を理工学の諸問題に適用するためには,粒子(要素)数は数十あるいは数百万となる場合があり(たとえば図-1),これらの解析モデルを現実的な計算時間で解析できる環境(ハードウエアならびにソフトウエア)の開発が期待されています.近年の計算機(CPU)の性能の飛躍的な向上により,ハードウエアに対応したソフトウエアすなわち並列計算アルゴリズムの開発が待たれています.並列計算アルゴリズムとしては,MPI等で複数のプロセスを作成して,それぞれのプロセスが解析モデルの物理的空間を分割して計算する方法や,OpenMP等で複数のスレッドで,解析モデルのデータ構造を分割して計算を行う方法,あるいはその両方を使った方法などがあげられます.またCPUが行う演算を,グラフィックボードに搭載されたGPU(図-2)が実行するGPGPUがあります.

*
図-1 粒状体挙動解析の計算高速化


図-2 WSに内蔵されたGPUボード

2. GPUを用いた高速化

個別要素法の計算速度向上のためにGPUを使用する場合の工夫として,サイクル中は,CPUとGPU間のデータ転送を最小限におさえ,また演算には縮約アルゴリズムを用いたり,グローバルメモリの一括処理機能を有効に利用する必要があります.高速化を調べる目的で図-3に示すような,矩形の箱内に粒子を作成し重力落下させるという簡単なモデルで,粒子数を変えてタイミングテストを行いました.比較するためのCPUあるいはGPUの仕様にもよりますが,1万個以上の粒子数の解析モデルでは,GPUで計算した方が計算速度は速くすることができました.さらに粒子数が10万個あるいはそれ以上になれば,さらなる効果が期待できることがわかりました.


図-3 タイミングテストのための解析モデル