HOME> > プロダクト一覧 > LS-DYNA > 機能

機能LS-DYNA:非線形・動的・流体構造連成シミュレーションツール

並列化のベンチマーク事例

並列化について

LS-DYNAでは、計算速度向上の為、2つの並列計算ロジックを用意しています。SMP(Shared Memory Parallel)とMPP(Massively Parallel Processing)です。SMPは、1つの筐体内にマルチCPUを搭載した1台のワークステーション、サーバ等を使用します。1つのジョブに対し同時に2つ以上のCPUを使用して計算が行われます。マシンの設定、使用方法が容易で、通常のシングルCPU版の全ての機能が使用できます。欠点としては、1つのメモリを共有していますので、プロセッサ数が多くなるとスケール効果が得られなくなってくる点です。

並列化 SMPのイメージ :非線形・動的・流体構造連成シミュレーションツール LS-DYNASMPのイメージ

一方、MPPは一般にクラスターシステムと呼ばれ、1つの問題を複数の部分に分割し、それぞれをネットワーク接続された複数のコンピュータに分散して並列計算を行います。メモリは各ノードで管理されますので、大規模なプロセッサ数に向きます。欠点としては、SMP版の一部の機能が使用できない点になります。それぞれのコンピュータ(ノードと呼びます)は1プロセッサのみ搭載したマシンでも、複数プロセッサ搭載したものでも結構ですが、CPUの性能は極力揃える必要があります。また、各ノードを接続するネットワークには出来るだけ高速なもの(1000BASE-T以上)を用います。個々のPCのハードウエア価格は低下してきていますので、SMP型スーパーコンピュータに比べますと、比較的低価格で大規模なシステムを構築することが出来ます。

並列化 MPPのイメージ:非線形・動的・流体構造連成シミュレーションツール LS-DYNAMPPのイメージ
SMPとMPPの比較表
  SMP
(Shared Memory Parallel)
MPP
(Massively Parallel Processing)
概要
  • 共有メモリ型のマルチプロセッサ
  • 1つの筐体内にある複数のCPUが、搭載されたメモリを共有して並列処理を実行
  • 並列化は、Doループとサブルーチンレベルで行われ、各並列処理終了後に同期を取る
  • 領域分割法(DDM)に基づく並列計算
  • 1つのアプリケーションを複数の部分に分割し、それぞれをネットワーク接続された複数のコンピュータに分散
  • 一般にPCクラスタとも呼ばれる
長所
  • シングルCPU版の機能が全て使用可能
  • 使用が容易(使用プロセッサ数を指定するだけ)
  • メモリは各ノード(PC)で管理される。(大規模なプロセッサ数向き)
  • ハードウエアが比較的安価
短所
  • メモリを共有する為、プロセッサ数が多くなるとスケール効果が得られない。(少数プロセッサ向き)
  • シングルCPU版の機能のうち、一部の機能が使用できない。

また、Dual coreのプロセッサにつきましても、1コアが1CPUと見なされますので2コア(CPU)を用いてSMPでの並列計算が可能です。システムの総CPU数は以下の様に、接続されているノード数(SMPの場合は1ノード)、プロセッサ数、コア数で決まります。

総CPU数=[ノード数]×[1ノード当りのプロセッサ数]×[1プロセッサ当りのコア数]

並列化の速度計測例

以下の様な2種類の解析に対して、マルチCPUによる計算時間を測定しました。板成形問題はnumisheet2002モデルによるフェンダーの成形加工計算になります。モデル規模は約62000節点、64000要素で、現象時間は6.5×10-2secです。また、衝突問題は自動車の衝突解析であり、モデル規模は約290000節点、535000要素、現象時間は0.03secです。

並列化の速度計測 板成形加工:非線形・動的・流体構造連成シミュレーションツール LS-DYNA 板成形加工
 
並列化の速度計測 衝突問題:非線形・動的・流体構造連成シミュレーションツール LS-DYNA 衝突問題
www.topcrunch.org 「neon_refined」データセット

下図に速度比を示します。速度比は、1CPUでの計算時間を1とした場合の計算速度倍率です。

板成形加工と衝突問題の計算速度比グラフ:非線形・動的・流体構造連成シミュレーションツール LS-DYNA 速度比

2CPUで1.6倍前後、4CPUで2.8倍程度の計算速度が得られていることが分かります。例えば、シングル版を用いて36時間かかっていた計算が、一晩(12時間)で終了することになります。
dual coreのプロセッサにつきましては、4CPUのSMPの場合速度比が余り伸びないことが分かります。一般的にシングルコアのプロセッサを用いた方がスケール効果が得られる様です。

一覧へ戻る