4 分で読了
0 views

必要なのは何枚のラベル付きナンバープレートか?

(How many labeled license plates are needed?)

さらに深い洞察を得る

AI戦略の専門知識を身につけ、競争優位性を構築しませんか?

AIBR プレミアム
年間たったの9,800円で
“AIに詳しい人”として
一目置かれる存在に!

プレミア会員になって、山ほどあるAI論文の中から効率よく大事な情報を手に入れ、まわりと圧倒的な差をつけませんか?

詳細を見る
【実践型】
生成AI活用キャンプ
【文部科学省認可】
満足度100%の生成AI講座
3ヶ月後には、
あなたも生成AIマスター!

「学ぶ」だけではなく「使える」ように。
経営者からも圧倒的な人気を誇るBBT大学の講座では、3ヶ月間質問し放題!誰1人置いていかずに寄り添います。

詳細を見る

田中専務

拓海先生、最近部下から「AIでナンバープレート認識を導入したら効率化できます」と言われましてね。ですが、学習用のラベル付きデータを集めるコストが高いと聞きます。実際、どの程度の枚数が必要なんですか?

AIメンター拓海

素晴らしい着眼点ですね!その疑問は実務導入の最初の壁です。結論を先に言うと、完全な正解はないが、少数の実データに対して合成データとデータ拡張を組み合わせることで、必要なラベル数を大幅に減らせるんですよ。

田中専務

要するに、実物の写真をたくさん集めなくても、パソコンで作った画像やAIが生成した画像で代替できるということですか?でも現場の変化に耐えられるか心配です。

AIメンター拓海

大丈夫、順を追って説明しますよ。まず押さえるべき要点は三つです。一、少量の実データから特徴を学び、二、コンピュータグラフィックスとGenerative Adversarial Networks (GAN)(GAN、敵対的生成ネットワーク)で多様な合成画像を作り、三、データ拡張で撮影時のゆがみや照明変化を模擬する。これで現場変化にかなり強くできるんです。

田中専務

生成した画像って、所詮は“作り物”ですよね。本当にナンバーの読み取り精度まで上げられるのですか。それと、コストと効果の観点でどれほどの投資が必要でしょうか。

AIメンター拓海

ごもっともです。論文の結果では、少数の実データと大量の合成データを組み合わせると、実データのみで学習した場合と同等かそれ以上の精度が出るケースが報告されています。投資対効果では、実撮影と手動ラベリングの人件費を大きく下げられるため、初期費用は合成データの準備とモデル構築に集中しますが、長期では回収しやすいのが特徴です。

田中専務

導入の現場での手間はどうでしょうか。クラウドにアップして学習させるのが一般的ですか。うちの現場はカメラが古いし、ネットワークも不安定です。

AIメンター拓海

現場ごとの実情を踏まえて設計しますよ。学習はクラウドで行い、推論(推論とは学習済みモデルで現場データを判定する処理)だけをローカルで行うこともできるんです。これならネットワーク負荷を抑えつつ、古いカメラへの適用も柔軟に対応できます。

田中専務

これって要するに、実データを少し用意して、それを元に作った合成データでモデルを育てれば、撮影条件のばらつきにも耐える読み取りシステムが作れるということ?

AIメンター拓海

その通りです。要点を三つにまとめると、一、実データは代表的な例を少量用意するだけでよい、二、合成データとデータ拡張で多様さを補う、三、評価は現場ごとに行い、微調整を繰り返す。これで現場導入の現実的な投資計画が立てられますよ。

田中専務

分かりました。要するに、まずは代表的な数十〜数百枚の実画像を集めて、それを基に合成データを作りつつモデルを作る。評価してダメなら現場データを少し足す、と段階的に進めればリスクが押さえられるということですね。私の言葉で整理すると、初期は実データ少量+合成データ多量でコストを下げ、現場評価で微調整して本稼働に移す流れでよいと理解しました。

監修者

阪上雅昭(SAKAGAMI Masa-aki)
京都大学 人間・環境学研究科 名誉教授

論文研究シリーズ
前の記事
ナノ振動子を用いた分類
(Nano-oscillator-based classification with a machine learning-compatible architecture)
次の記事
文字列カーネルをテストセットに適応させて精度を高める方法
(Improving the results of string kernels in sentiment analysis and Arabic dialect identification by adapting them to your test set)
関連記事
カリキュラム学習主導PIELMsによる流体流れシミュレーション
(Curriculum Learning-Driven PIELMs for Fluid Flow Simulations)
変換器の訓練可能性を予測する信号伝播の幾何学的力学
(Geometric Dynamics of Signal Propagation Predict Trainability of Transformers)
公式統計と調査業務における機械学習の品質次元とアルゴリズム公平性の接続
(Connecting Algorithmic Fairness to Quality Dimensions in Machine Learning in Official Statistics and Survey Production)
深いXMM-NewtonとChandra観測による高赤方偏移銀河団の詳細なX線質量解析
(Deep XMM-Newton and Chandra Observations of ClJ1226.9+3332: A Detailed X-ray Mass Analysis of a z = 0.89 Galaxy Cluster)
機械学習による金属有機構造体のアブイニオ品質の力場
(Machine learned Force-Fields for an ab-initio Quality Description of Metal-Organic Frameworks)
効率的な計画のためのハイブリッド探索と完全性保証
(Hybrid Search for Efficient Planning with Completeness Guarantees)
この記事をシェア

有益な情報を同僚や仲間と共有しませんか?

AI技術革新 - 人気記事
ブラックホールと量子機械学習の対応
(Black hole/quantum machine learning correspondence)
生成AI検索における敏感なユーザークエリの分類と分析
(Taxonomy and Analysis of Sensitive User Queries in Generative AI Search System)
DiReDi:AIoTアプリケーションのための蒸留と逆蒸留
(DiReDi: Distillation and Reverse Distillation for AIoT Applications)

PCも苦手だった私が

“AIに詳しい人“
として一目置かれる存在に!
  • AIBRプレミアム
  • 実践型生成AI活用キャンプ
あなたにオススメのカテゴリ
論文研究
さらに深い洞察を得る

AI戦略の専門知識を身につけ、競争優位性を構築しませんか?

AIBR プレミアム
年間たったの9,800円で
“AIに詳しい人”として一目置かれる存在に!

プレミア会員になって、山ほどあるAI論文の中から効率よく大事な情報を手に入れ、まわりと圧倒的な差をつけませんか?

詳細を見る
【実践型】
生成AI活用キャンプ
【文部科学省認可】
満足度100%の生成AI講座
3ヶ月後には、あなたも生成AIマスター!

「学ぶ」だけではなく「使える」ように。
経営者からも圧倒的な人気を誇るBBT大学の講座では、3ヶ月間質問し放題!誰1人置いていかずに寄り添います。

詳細を見る

AI Benchmark Researchをもっと見る

今すぐ購読し、続きを読んで、すべてのアーカイブにアクセスしましょう。

続きを読む