4 分で読了
0 views

暗闇を恐れない顔認証:近赤外

(NIR)と可視光(VIS)の橋渡しによる顔認証(Not Afraid of the Dark: NIR-VIS Face Recognition via Cross-spectral Hallucination and Low-rank Embedding)

さらに深い洞察を得る

AI戦略の専門知識を身につけ、競争優位性を構築しませんか?

AIBR プレミアム
年間たったの9,800円で
“AIに詳しい人”として
一目置かれる存在に!

プレミア会員になって、山ほどあるAI論文の中から効率よく大事な情報を手に入れ、まわりと圧倒的な差をつけませんか?

詳細を見る
【実践型】
生成AI活用キャンプ
【文部科学省認可】
満足度100%の生成AI講座
3ヶ月後には、
あなたも生成AIマスター!

「学ぶ」だけではなく「使える」ように。
経営者からも圧倒的な人気を誇るBBT大学の講座では、3ヶ月間質問し放題!誰1人置いていかずに寄り添います。

詳細を見る

田中専務

拓海先生、最近部下から夜間監視カメラのAI化を急げと言われまして。そもそも夜のカメラ映像は普通の顔認証と違うと聞きましたが、何が問題なのでしょうか。

AIメンター拓海

素晴らしい着眼点ですね!夜間カメラは近赤外線、英語でNIRと呼ぶ光で撮ることが多いんです。普段の学習データは可視光、VISで集まっているので、単純に一致させられない問題があるんですよ。

田中専務

要するに、昼に学んだ顔と夜に撮った顔が違って見えるから、認証精度が落ちると。うちが導入しても現場で使える水準になるんですかね。

AIメンター拓海

大丈夫、方法がありますよ。論文では学習済みのVIS向けモデルをそのまま使い、入力側を変える方法と出力側を整える方法の二つを組み合わせています。新たに大量データを集めて再学習する必要が薄い点が特徴です。

田中専務

再学習が不要というのは投資対効果の面で魅力的です。ただ、具体的に入力側と出力側をどう変えるのか、現場での負担はどれほどか教えてください。

AIメンター拓海

いい質問ですね。簡単に三点に整理します。1つ目はNIR画像から見かけ上のVIS画像を生成する『ハルシネーション』という入力処理。2つ目は特徴量空間でNIRとVISを揃える『低ランク埋め込み』という出力処理。3つ目は両方を組み合わせると精度がさらに向上する点です。

田中専務

これって要するに、夜の映像を『昼っぽく見せる加工』をしてから既存の顔認証に流し、最後に特徴のズレを整えるということですか。

AIメンター拓海

その通りですよ!表現を変えることで既存の強いモデルを活かす発想です。運用面ではまず小さな検証を回し、ハルシネーションの品質や埋め込み後の距離分布を確認することを勧めます。一気に全社導入せず段階的に進めると失敗が少ないです。

田中専務

現場が怖がらない程度で段階的に進める、と。具体的な成果はどれくらい上がるものなのでしょうか。うちの監視用途で実用的か見極めたいのです。

AIメンター拓海

論文のベンチマークでは、両方を組み合わせることで従来手法より大きく改善しています。実務ではデータの性質やカメラ環境で差は出ますが、少量のNIR・VIS対応データでまずは効果を確認できますよ。一緒に現場のサンプルで試してみましょう。

田中専務

分かりました。まずは小さく試して判断する。コスト感と効果を見てから拡大する、これなら現実的です。では最後に私の言葉で確認させてください、こう理解して間違いありませんか。

AIメンター拓海

素晴らしいです、その通りです。一緒に小さなPoCを設計して、投資対効果を数字で示しましょう。大丈夫、一緒にやれば必ずできますよ。

田中専務

では私の確認です。夜間のNIR映像を昼っぽく変換して既存のVIS向けAIに通し、出力の特徴を低ランクで整えてズレを小さくする。まずは現場サンプルでPoCを回し、効果が出れば段階的に投資する。これで進めます。

監修者

阪上雅昭(SAKAGAMI Masa-aki)
京都大学 人間・環境学研究科 名誉教授

論文研究シリーズ
前の記事
半無限グラフェンシート配列における表面プラズモニック格子ソリトン
(Surface Plasmonic Lattice Solitons in Semi-infinite Graphene Sheet Arrays)
次の記事
フレーズ局在化と視覚関係検出:包括的な画像と言語の手がかり
(Phrase Localization and Visual Relationship Detection with Comprehensive Image-Language Cues)
関連記事
アフィン部分空間の代数的クラスタリング
(Algebraic Clustering of Affine Subspaces)
大規模マルチモーダルモデルの頑健な適応による検索補強型有害ミーム検出
(Robust Adaptation of Large Multimodal Models for Retrieval Augmented Hateful Meme Detection)
アーティファクト抑制バイオインピーダンスによる非侵襲的膀胱容量推定
(Non-invasive urinary bladder volume estimation with artefact-suppressed bio-impedance measurements)
バックプロップKF: Backprop KF: Learning Discriminative Deterministic State Estimators
PQA:自由形式の科学的問合せに対するゼロショットタンパク質問答
(PQA: Zero-shot Protein Question Answering for Free-form Scientific Enquiry with Language Models)
Gboard言語モデルのフェデレーテッド学習と差分プライバシー
(Federated Learning of Gboard Language Models with Differential Privacy)
この記事をシェア

有益な情報を同僚や仲間と共有しませんか?

AI技術革新 - 人気記事
ブラックホールと量子機械学習の対応
(Black hole/quantum machine learning correspondence)
生成AI検索における敏感なユーザークエリの分類と分析
(Taxonomy and Analysis of Sensitive User Queries in Generative AI Search System)
DiReDi:AIoTアプリケーションのための蒸留と逆蒸留
(DiReDi: Distillation and Reverse Distillation for AIoT Applications)

PCも苦手だった私が

“AIに詳しい人“
として一目置かれる存在に!
  • AIBRプレミアム
  • 実践型生成AI活用キャンプ
あなたにオススメのカテゴリ
論文研究
さらに深い洞察を得る

AI戦略の専門知識を身につけ、競争優位性を構築しませんか?

AIBR プレミアム
年間たったの9,800円で
“AIに詳しい人”として一目置かれる存在に!

プレミア会員になって、山ほどあるAI論文の中から効率よく大事な情報を手に入れ、まわりと圧倒的な差をつけませんか?

詳細を見る
【実践型】
生成AI活用キャンプ
【文部科学省認可】
満足度100%の生成AI講座
3ヶ月後には、あなたも生成AIマスター!

「学ぶ」だけではなく「使える」ように。
経営者からも圧倒的な人気を誇るBBT大学の講座では、3ヶ月間質問し放題!誰1人置いていかずに寄り添います。

詳細を見る

AI Benchmark Researchをもっと見る

今すぐ購読し、続きを読んで、すべてのアーカイブにアクセスしましょう。

続きを読む