こちらのベンチマークは、2021年のNVIDIA社のカンファレンス AI daysで紹介したベンチマーク結果になります。

NVIDIA GPU インスタンス

ニューラルネットワーク分子動力学(NNMD)におけるCPUに対して各GPUの相対的処理速度比較を実施しました。用いたCPUおよびGPUの情報を示します。ニューラルネットワークMDのソフトには LAMMPS + DeePMD-kitを使用しています。

ディバイス個数
Intel® Xeon® Gold 6132 1
NVIDIA P1001
NVIDIA V100 1
NVIDIA A100 1

ニューラルネットワークMDの設定条件

ベンチマークに用いたモデルおよび計算条件を示します。

CeO2 10x10x10 (12,00原子)
計算条件
  • LAMMPS + DeePMD-kit v1.3
  • NPT アンサンブル
  • CeO2 (12,000 原子)

ベンチマーク結果

CPU(Intel® Xeon® Gold 6132)に対して、それぞれのGPUの相対速度を示します。P100はCPUの5.42倍、V100はCPUの7.92倍、A100は16.01倍とGPUの方が速い結果でした。最新のA100はV100の2倍速いことが分かります。

各GPUの相対的処理速度比較

NVIDIA GPU A100の枚数を増やした場合の並列化効率を示します。GPU2枚で1.77倍、4枚で2.80倍、8倍で4.47倍と加速しています。

NVIDIA GPU A100高速化率
まとめ
  • GPUを用いると大規模モデルのニューラルネットワークMDを実施することが可能です。
  • NVIDIA A100は、これまでのディバイスよりも遥かに速く、高速化率も高い結果でした。

お問い合わせ

ご依頼及び業務内容へのご質問などお気軽にお問い合わせください