こちらのベンチマークは、2021年のNVIDIA社のカンファレンス AI daysで紹介したベンチマーク結果になります。

NVIDIA GPU インスタンス

ニューラルネットワーク分子動力学(NNMD)におけるCPUに対して各GPUの相対的処理速度比較を実施しました。用いたCPUおよびGPUの情報を示します。ニューラルネットワークMDのソフトには LAMMPS + DeePMD-kitを使用しています。

ディバイス個数
Intel® Xeon® Gold 6132 1
NVIDIA P1001
NVIDIA V100 1
NVIDIA A100 1

ニューラルネットワークMDの設定条件

ベンチマークに用いたモデルおよび計算条件を示します。

CeO2 10x10x10 (12,00原子)
計算条件
  • LAMMPS + DeePMD-kit v1.3
  • NPT アンサンブル
  • CeO2 (12,000 原子)

ベンチマーク結果

CPU(Intel® Xeon® Gold 6132)に対して、それぞれのGPUの相対速度を示します。P100はCPUの5.42倍、V100はCPUの7.92倍、A100は16.01倍とGPUの方が速い結果でした。最新のA100はV100の2倍速いことが分かります。

各GPUの相対的処理速度比較

NVIDIA GPU A100の枚数を増やした場合の並列化効率を示します。GPU2枚で1.77倍、4枚で2.80倍、8倍で4.47倍と加速しています。

NVIDIA GPU A100高速化率
まとめ
  • GPUを用いると大規模モデルのニューラルネットワークMDを実施することが可能です。
  • NVIDIA A100は、これまでのディバイスよりも遥かに速く、高速化率も高い結果でした。