4 分で読了
2 views

SMILES文字列で学ぶ

(LEARNING TO SMILE(S))

さらに深い洞察を得る

AI戦略の専門知識を身につけ、競争優位性を構築しませんか?

AIBR プレミアム
年間たったの9,800円で
“AIに詳しい人”として
一目置かれる存在に!

プレミア会員になって、山ほどあるAI論文の中から効率よく大事な情報を手に入れ、まわりと圧倒的な差をつけませんか?

詳細を見る
【実践型】
生成AI活用キャンプ
【文部科学省認可】
満足度100%の生成AI講座
3ヶ月後には、
あなたも生成AIマスター!

「学ぶ」だけではなく「使える」ように。
経営者からも圧倒的な人気を誇るBBT大学の講座では、3ヶ月間質問し放題!誰1人置いていかずに寄り添います。

詳細を見る

田中専務

拓海先生、最近部下から「論文読め」と言われましてね。タイトルが英語で何やらSMILESって書いてある。化学の話だとは思うのですが、うちの業務に関係ありますか?投資対効果が気になります。

AIメンター拓海

素晴らしい着眼点ですね!SMILESは化学式を直列の文字列で表す方法です。要するに長い文字列を機械学習で読むと、化合物の性質を予測できるという研究ですよ。大丈夫、一緒に見ていけば必ずできますよ。

田中専務

文字列で化学を表すんですか。うちの現場の図面をテキストで扱うイメージでしょうか。そうすると既存の手作りルールより自動で良くなるという理解でいいですか。

AIメンター拓海

その見立ては近いです。専門用語を使うと、ここではSMILES文字列を自然言語処理(Natural Language Processing、NLP)と同じように扱い、特徴を自動で学習させます。要点は三つです。人手の特徴に頼らず学べる、少ないデータでもCNNが効く、構造的な洞察が得られる、ですよ。

田中専務

なるほど。CNNというのは聞いたことがありますが、具体的にどんな風にSMILESを扱うのですか。文字列のどの部分が効いているのか分かるなら、現場への説明がしやすいんです。

AIメンター拓海

CNNは畳み込みニューラルネットワークの略で、画像や文の局所パターンを捉えるのが得意です。SMILESを小さな文字群に分けてパターンを学ばせると、どの部分が効いているか可視化できます。説明性が出るのは経営判断で重要ですね。

田中専務

これって要するに、従来の専門家が作った指標を使わずに、文字列を機械に学ばせるだけで同等かそれ以上の判断ができるということですか。

AIメンター拓海

その理解で合っています。追加で言うと、SMILESは分子のつながりを文字列に落としたものなので、小さな文字列の変化が大きな性質の変化を示すことがある。これが自然言語の感情分析と似ているため、NLPの手法が効くんです。

田中専務

投資対効果の話に戻します。現場に導入する際のコストやリスクはどう見れば良いですか。うちの場合データはそこまで多くない。現実的に使えますか。

AIメンター拓海

重要な問いです。要点は三つです。まず、データが少なくてもCNNはデータ拡張や転移学習で対応できること。次に、手作業の特徴設計を減らせるため専門人材の工数削減になること。最後に、解釈可能性を保てば意思決定に組み込みやすいことです。大丈夫、一緒にステップを踏めば導入は可能ですよ。

田中専務

分かりました。まずは小さなプロジェクトで検証してみます。要するに、SMILESをテキストとして扱うNLPの手法を使えば、我々のような少量データの現場でも手作業の特徴設計を減らしつつ説明性のある判定ができる、ということで間違いないですか。

AIメンター拓海

その通りです!小さな実験を繰り返して学べば、やがて現場に落とせるモデルができますよ。大丈夫、一緒にやれば必ずできますよ。

田中専務

では私の言葉で整理します。SMILESという化学の文字列を、NLP技術で学ばせることで、専門家が書いた指標に頼らずに性質予測ができ、データの工夫次第で我々の現場でも十分使えるということですね。ありがとうございました。

論文研究シリーズ
前の記事
スパース・グループLassoのGAP安全スクリーニング規則
(GAP Safe Screening Rules for Sparse-Group Lasso)
次の記事
混合メンバーシップと部分ラベルモデルの相互汚染解析
(A Mutual Contamination Analysis of Mixed Membership and Partial Label Models)
関連記事
スケールした分散トレーニングのための適応的合意勾配集約
(Adaptive Consensus Gradients Aggregation for Scaled Distributed Training)
配電網故障の事前予測を可能にする保護リレー記録と機械学習
(DISTRIBUTION NETWORK FAULT PREDICTION UTILISING PROTECTION RELAY DISTURBANCE RECORDINGS AND MACHINE LEARNING)
命令追従のための整列に基づく作曲意味論
(Alignment-Based Compositional Semantics for Instruction Following)
自由形式手ジェスチャー理解をゼロショットで実現するGestureGPT
(GestureGPT: Toward Zero-Shot Free-Form Hand Gesture Understanding with Large Language Model Agents)
言語誘導型概念ボトルネックモデルによる解釈可能な継続学習
(Language Guided Concept Bottleneck Models for Interpretable Continual Learning)
合成による継続事前学習
(Synthetic Continued Pretraining)
この記事をシェア

有益な情報を同僚や仲間と共有しませんか?

AI技術革新 - 人気記事
ブラックホールと量子機械学習の対応
(Black hole/quantum machine learning correspondence)
生成AI検索における敏感なユーザークエリの分類と分析
(Taxonomy and Analysis of Sensitive User Queries in Generative AI Search System)
DiReDi:AIoTアプリケーションのための蒸留と逆蒸留
(DiReDi: Distillation and Reverse Distillation for AIoT Applications)

PCも苦手だった私が

“AIに詳しい人“
として一目置かれる存在に!
  • AIBRプレミアム
  • 実践型生成AI活用キャンプ
あなたにオススメのカテゴリ
論文研究
さらに深い洞察を得る

AI戦略の専門知識を身につけ、競争優位性を構築しませんか?

AIBR プレミアム
年間たったの9,800円で
“AIに詳しい人”として一目置かれる存在に!

プレミア会員になって、山ほどあるAI論文の中から効率よく大事な情報を手に入れ、まわりと圧倒的な差をつけませんか?

詳細を見る
【実践型】
生成AI活用キャンプ
【文部科学省認可】
満足度100%の生成AI講座
3ヶ月後には、あなたも生成AIマスター!

「学ぶ」だけではなく「使える」ように。
経営者からも圧倒的な人気を誇るBBT大学の講座では、3ヶ月間質問し放題!誰1人置いていかずに寄り添います。

詳細を見る

AI Benchmark Researchをもっと見る

今すぐ購読し、続きを読んで、すべてのアーカイブにアクセスしましょう。

続きを読む