機械学習のコードを作成したことのない方でもAzureMLを用いることで、簡単に物性予測することができます。本事例では、Microsoft Azureが提供する機械学習アプリケーションのAzureMLを活用し、熱電特性の予測を行いました。データにはBoltzTraP Materials Project Data1を使用し、記述子を付けたデータを基に熱電特性であるN型のパワーファクターを予測します。

N型のパワーファクター および記述子を追加したデータセット

AzureMLに用意したデータセットを取り込み、学習モデルを作製します。様々なアルゴリズムを自動的に精度探索する機能の 自動ML(AutoML)を使用します。このAutoMLはWeb画面上でマウス操作のみで行うため、初めて機械学習を行う方でも難なく行えます。

AzureMLの自動ML(AutoML)の選択画面

AutoML が数十個のアルゴリズムの精度検証を行い、記述子の寄与度や各学習モデルの精度をWeb上でグラフとして確認するこができます。

AzureML上で記述子寄与度、学習モデル精度を可視化

ここでは最も精度の良かったモデルを推論サーバーとし、2元系化合物で熱電特性が最大になる組合せ、および熱電特性が1.4 W/mKに近くなる組合せについて予測を行いランキング順にしました。

ランキング順にした2元系化合物の予測値

機械学習が予測した候補を基に、実際に作製可能な組み合わせの候補選定に役立たせることが可能です。推論サーバーを用いて予測にかかった時間とコストについてですが、
$0.29/hour のマシンで、1候補予測に5秒程度で2万ケース予測を行いました。(5秒×2万)

多原型予測を行うにあたっては候補数が膨大になってしまうため、事前にBIツールを活用し、どのような元素が含まれた場合 熱電特性が 高くなるなどの情報を基にし予測すると効率的です。

PowerBIで可視化、分析
まとめ
  • AzureMLを用いることで、経験の少ない方でも機械学習を行うことが可能
  • AutoML機能を用いれば数十個のある語リズムを自動探索でき便利である。
  • 機械学習を簡単に連携にはデータベース、ETLツールを活用したプラットフォームが便利である。
    詳しくはこちら

1) BoltzTraP Materials Project Datahttps://figshare.com/articles/dataset/BoltzTraP_Materials_Project_Dataset/7221410
(ライセンス:MIT)