ドメイン転移を用いた深層ネットワークによる画像信頼性分析(Image Credibility Analysis with Effective Domain Transferred Deep Networks)

田中専務

拓海先生、最近現場で「フェイク画像が拡散している」と聞きまして、社内の広報でも混乱がありそうです。そもそも画像の信頼性ってAIで見分けられるものなのでしょうか。

AIメンター拓海

素晴らしい着眼点ですね!大丈夫、画像の信頼性をAIで分析できるんです。今回は視覚的な特徴を学ぶ深層学習、つまりConvolutional Neural Network (CNN)(畳み込みニューラルネットワーク)を使って見分ける研究があるんですよ。

田中専務

なるほど。ただ現場の写真とか広告の画像って、普通の物体認識とは違うんですよね。何が難しいんですか。

AIメンター拓海

良い質問です。簡単に言うと、偽画像は人の注意をひくために視覚的に派手だったり心理的なトリックを含む点で普通の物体認識とは特徴が異なるんです。だから一般的なImageNetのようなデータで学んだモデルだけでは弱いんですよ。

田中専務

それならデータが肝心ということですか。けれど偽物の画像って人手で全部ラベル付けするのは大変でしょう。

AIメンター拓海

その通りです。だからこの研究ではTransfer Learning (TL)(転移学習)を利用しています。関連する大量の画像をソーシャルメディアから弱ラベルで自動収集して、そこから学んだ特徴を本当にラベル付きの少量データに移すのです。

田中専務

弱ラベルというのは雑なラベル、という理解でいいですか。これって要するにラベルが間違っている可能性があるデータを利用するということ?

AIメンター拓海

正確です。Weakly-labeled(弱ラベル)とは必ずしも人の専門家が付けた厳密なラベルではないという意味です。ただしこの手法はInstance Weighting(インスタンス重み付け)を併用して、ノイズの多いサンプルの影響を減らしつつ有益な情報を引き出すことができます。

田中専務

なるほど。投資対効果でいうと、最初に大量の弱ラベルを集めてモデルを作るのは現場の負担が少なそうですけれど、実務に入れると誤検知が怖いです。実際の精度はどうなんでしょう。

AIメンター拓海

良い懸念ですね。著者らは実運用に即した少量の正確なラベルをターゲットドメインとして用い、そこへ段階的に知識を移すことで、ノイズの影響を低減して精度を高めています。要点は三つです:関連データの自動収集、CNNでの視覚特徴学習、インスタンス重み付けでのノイズ対処ですよ。

田中専務

分かりました、整理すると「手間をかけずに関連データを集めて学習し、要らないノイズを下げる工夫で実用に耐える」ということですね。では最後に私の言葉で要点を言い直してもよろしいですか。

AIメンター拓海

ぜひお願いします。自分の言葉で整理することが最短の理解ですから。大丈夫、一緒にやれば必ずできますよ。

田中専務

要するに、まずは関連性のある大量データを手間をかけずに集めてモデルを育て、少量の正確なデータで調整しながら、間違いやすい例の重みを下げて精度を上げるということですね。これなら現場導入の負担は抑えられそうです。

AIBRプレミアム

関連する記事

AI Business Reviewをもっと見る

今すぐ購読し、続きを読んで、すべてのアーカイブにアクセスしましょう。

続きを読む