こちらのベンチマークは、2021年のNVIDIA社のカンファレンス AI daysで紹介したベンチマーク結果になります。
NVIDIA GPU インスタンス
ニューラルネットワーク分子動力学(NNMD)におけるCPUに対して各GPUの相対的処理速度比較を実施しました。用いたCPUおよびGPUの情報を示します。ニューラルネットワークMDのソフトには LAMMPS + DeePMD-kitを使用しています。
ディバイス | 個数 |
---|---|
Intel® Xeon® Gold 6132 | 1 |
NVIDIA P100 | 1 |
NVIDIA V100 | 1 |
NVIDIA A100 | 1 |
ニューラルネットワークMDの設定条件
ベンチマークに用いたモデルおよび計算条件を示します。
ベンチマーク結果
CPU(Intel® Xeon® Gold 6132)に対して、それぞれのGPUの相対速度を示します。P100はCPUの5.42倍、V100はCPUの7.92倍、A100は16.01倍とGPUの方が速い結果でした。最新のA100はV100の2倍速いことが分かります。
NVIDIA GPU A100の枚数を増やした場合の並列化効率を示します。GPU2枚で1.77倍、4枚で2.80倍、8倍で4.47倍と加速しています。
まとめ
- GPUを用いると大規模モデルのニューラルネットワークMDを実施することが可能です。
- NVIDIA A100は、これまでのディバイスよりも遥かに速く、高速化率も高い結果でした。