固体材料の構造予測に機械学習を適用する研究 — An Investigation of Machine Learning Methods Applied to Structure Prediction in Condensed Matter

田中専務

拓海先生、最近部下から「機械学習で材料の構造が分かるようになる」と聞きまして、正直よくわかりません。要するにウチの現場で使える話なんですか?

AIメンター拓海

素晴らしい着眼点ですね!大丈夫、一緒に整理すれば必ず見えてきますよ。端的に言うと、この論文は「計測したスペクトルデータ(NMR)を圧縮して、機械学習で構造を予測する」手法を示しているんです。

田中専務

計測データを圧縮して…って、例えばExcelでグラフを小さくするような話ですか。それと投資対効果はどう見ればいいですか。

AIメンター拓海

いい質問ですよ。身近な例で言うと、長い報告書を要点だけに圧縮して上司に渡すようなものです。ここでの要点はPrincipal Component Analysis (PCA)(主成分分析)で抽出します。投資対効果を見るには、①現行でかかっている解析時間の削減、②実験やシミュレーションの回数削減、③新材料探索の速度向上、の三点が評価軸になりますよ。

田中専務

なるほど。で、機械学習って大がかりなデータやクラウドが必要になる印象があるんですが、うちのような中小でも取り組めますか。

AIメンター拓海

素晴らしい着眼点ですね!現実的な導入方法は三段階に分けられますよ。最初は既存データを小規模に使って検証、次に外部計算資源やクラウドを一時利用、最後に現場運用での自動化です。最初から全部を自社内で完結させる必要はありませんよ。

田中専務

データの量や質がよく分かりません。論文ではどうやってデータを作って学習させたんですか。

AIメンター拓海

良い点に目が行っていますね。論文では実際の実験だけでなく、第一原理(first-principles、ab-initio)計算で多数の構造モデルを生成し、そこから47TiのNuclear Magnetic Resonance (NMR)(核磁気共鳴)スペクトルを計算してデータセットを作っています。要は、実験と計算を組み合わせて“教師データ”を大量に用意しているのです。

田中専務

これって要するに、NMRの波形を小さくして機械学習に食わせれば、どんな原子配置か当てられるってことですか?

AIメンター拓海

その理解でほぼ合っていますよ。要点を三つにまとめると、1) スペクトルをPrincipal Component Analysis (PCA)(主成分分析)で90%以上圧縮して扱いやすくする、2) Support Vector Regression (SVR)(サポートベクタ回帰)とArtificial Neural Networks (ANN)(人工ニューラルネットワーク)を比較し、どちらでも高精度に構造を予測できること、3) 実験/計算の前準備を整えれば現場での応用可能性があること、です。大丈夫、一緒にやれば必ずできますよ。

田中専務

分かりました。要はデータの準備と、最初の検証をきちんとやれば、投資に見合う効果が期待できると。自分の言葉で言うと、NMRの波形を要約して機械学習に学ばせれば、材料の構造を速く当てられるようになる、ということですね。

AIBRプレミアム

関連する記事

AI Business Reviewをもっと見る

今すぐ購読し、続きを読んで、すべてのアーカイブにアクセスしましょう。

続きを読む