4 分で読了
0 views

Which Country is This? Automatic Country Ranking of Street View Photos

(どの国かを当てる?ストリートビュー写真の自動国ランキング)

さらに深い洞察を得る

AI戦略の専門知識を身につけ、競争優位性を構築しませんか?

AIBR プレミアム
年間たったの9,800円で
“AIに詳しい人”として
一目置かれる存在に!

プレミア会員になって、山ほどあるAI論文の中から効率よく大事な情報を手に入れ、まわりと圧倒的な差をつけませんか?

詳細を見る
【実践型】
生成AI活用キャンプ
【文部科学省認可】
満足度100%の生成AI講座
3ヶ月後には、
あなたも生成AIマスター!

「学ぶ」だけではなく「使える」ように。
経営者からも圧倒的な人気を誇るBBT大学の講座では、3ヶ月間質問し放題!誰1人置いていかずに寄り添います。

詳細を見る

田中専務

拓海先生、最近話題の論文を聞いたのですが、道路の写真だけでどの国か当てるという話があると聞きました。うちの現場で使えるものなのでしょうか。要点を簡単に教えてください。

AIメンター拓海

素晴らしい着眼点ですね!これは、Google Street Viewのような街路写真から「どの国か」を順位付けするシステムで、画像の色合い、写っている物体、写植(文字情報)や太陽の位置など、複数の手掛かりを組み合わせることで推定するシステムです。大丈夫、一緒に見ていけば使い方や投資対効果も分かりますよ。

田中専務

なるほど。具体的にはどんな手掛かりが効くのですか。現場で使うなら誤認やコストが気になります。

AIメンター拓海

要点は三つです。第一に、色の分布(color histogram、カラーヒストグラム)が場所の雰囲気を示す。第二に、物体検出は場の特徴を拾う。ここで用いられるのがYOLO (You Only Look Once、YOLO、物体検出器)です。第三に、写っている文字や説明文を大きな言語モデルで照会し、画像の意味を補うやり方です。投資対効果に関しては、まずは限定領域でのPoC(実証実験)を勧めますよ。

田中専務

これって要するに、写真の色と見えるもの、それに写っている文字をコンビネーションで見てランキングを出すということ?

AIメンター拓海

まさにその通りです!その組合せを統合して確率の高い国を順位付けするのです。現場導入のリスクを減らすには、まずは業務に近い写真で評価し、どのモジュール(色、物体、文字、太陽位置)が効いているかを確認することが重要です。

田中専務

データやプライバシーはどうですか。Street Viewを使う場合の制約も気になります。

AIメンター拓海

重要な点です。公開されたStreet Viewや許可を得た画像を使うのが基本で、企業内写真を評価するなら社内でのみ動く仕組みを作るか、匿名化・集約化して扱う必要があります。運用面では外部APIをそのまま用いるのか、ローカル推論に切り替えるのかを経営判断で決めると良いです。

田中専務

実際の精度はどれくらいなのですか。導入判断の材料にしたいのです。

AIメンター拓海

論文の評価では、110カ国を対象にランダムに抽出した画像で順位付けを行い、平均ランクは14.7、中央値は7でした。つまり常に正解が1位に来るわけではないが、上位に候補を絞れる点で有用です。業務で使うなら正解を1位にするよりも、上位候補を提示して現場判断を助ける運用が現実的です。

田中専務

分かりました。では最後に、私の言葉で整理します。写真の色や写っている物、それに文字情報をAIで解析して、国ごとの候補を順位で示す。現場運用では上位候補を参照して判断するのが現実的、ということでよろしいですか。

AIメンター拓海

その通りですよ。素晴らしい着眼点ですね!まずは小さな実験から始めて、どの情報が最も効くかを見極め、段階的に導入していきましょう。大丈夫、一緒にやれば必ずできますよ。

論文研究シリーズ
前の記事
共同学習言語モデルにおける解読意識型多言語学習
(Decipherment-Aware Multilingual Learning in Jointly Trained Language Models)
次の記事
不確実性下での普遍量子ゲートのメタ学習支援ロバスト制御
(Meta-learning assisted robust control of universal quantum gates with uncertainties)
関連記事
脆性破壊の予測に向けた生成的アプローチ
(DeepFracture: A Generative Approach for Predicting Brittle Fractures with Neural Discrete Representation Learning)
ネステッド非負コーン解析
(Nested Nonnegative Cone Analysis)
リスク情報を組み込んだ拡散トランスフォーマーによるロングテール軌跡予測
(Risk-Informed Diffusion Transformer for Long-Tail Trajectory Prediction in the Crash Scenario)
ChatGPTとBing Chatを思考の対象として用いることでSTEM学習を強化する
(Enhancing STEM Learning with ChatGPT and Bing Chat as Objects-to-Think-With: A Case Study)
マルチパスフィードバック再帰ニューラルネットワークによるシーン解析
(Multi-Path Feedback Recurrent Neural Networks for Scene Parsing)
OULADデータ準備を自動化するRパッケージ
(ouladFormat R Package: Preparing the OULAD for Analysis)
この記事をシェア

有益な情報を同僚や仲間と共有しませんか?

AI技術革新 - 人気記事
ブラックホールと量子機械学習の対応
(Black hole/quantum machine learning correspondence)
生成AI検索における敏感なユーザークエリの分類と分析
(Taxonomy and Analysis of Sensitive User Queries in Generative AI Search System)
DiReDi:AIoTアプリケーションのための蒸留と逆蒸留
(DiReDi: Distillation and Reverse Distillation for AIoT Applications)

PCも苦手だった私が

“AIに詳しい人“
として一目置かれる存在に!
  • AIBRプレミアム
  • 実践型生成AI活用キャンプ
あなたにオススメのカテゴリ
論文研究
さらに深い洞察を得る

AI戦略の専門知識を身につけ、競争優位性を構築しませんか?

AIBR プレミアム
年間たったの9,800円で
“AIに詳しい人”として一目置かれる存在に!

プレミア会員になって、山ほどあるAI論文の中から効率よく大事な情報を手に入れ、まわりと圧倒的な差をつけませんか?

詳細を見る
【実践型】
生成AI活用キャンプ
【文部科学省認可】
満足度100%の生成AI講座
3ヶ月後には、あなたも生成AIマスター!

「学ぶ」だけではなく「使える」ように。
経営者からも圧倒的な人気を誇るBBT大学の講座では、3ヶ月間質問し放題!誰1人置いていかずに寄り添います。

詳細を見る

AI Benchmark Researchをもっと見る

今すぐ購読し、続きを読んで、すべてのアーカイブにアクセスしましょう。

続きを読む