4 分で読了
0 views

野球ではなくクリケットの「審判ジェスチャー」検出データセットと予備結果

(A Dataset and Preliminary Results for Umpire Pose Detection)

さらに深い洞察を得る

AI戦略の専門知識を身につけ、競争優位性を構築しませんか?

AIBR プレミアム
年間たったの9,800円で
“AIに詳しい人”として
一目置かれる存在に!

プレミア会員になって、山ほどあるAI論文の中から効率よく大事な情報を手に入れ、まわりと圧倒的な差をつけませんか?

詳細を見る
【実践型】
生成AI活用キャンプ
【文部科学省認可】
満足度100%の生成AI講座
3ヶ月後には、
あなたも生成AIマスター!

「学ぶ」だけではなく「使える」ように。
経営者からも圧倒的な人気を誇るBBT大学の講座では、3ヶ月間質問し放題!誰1人置いていかずに寄り添います。

詳細を見る

田中専務

拓海先生、聞いたところによると「審判の姿勢でハイライトを自動抽出する研究」があると聞きました。うちの現場でも映像から重要な場面だけ取り出せれば助かるのですが、いったい何を検出するんですか。

AIメンター拓海

素晴らしい着眼点ですね!これはクリケットという競技で、審判が見せる特定のジェスチャーを画像から認識して、自動で「重要場面」を切り出す研究ですよ。難しく聞こえますが、要は審判のポーズを見つければ、その直前直後のプレーをハイライトにできるんです。

田中専務

それはわかりました。ですが現場は騒がしいし、人と似た動きを選手がしていることもあるでしょう。検出はどの程度当たるものなんですか。

AIメンター拓海

いい質問ですよ。研究では二段階の仕組みを使っています。まず「映像に審判がいるか」を判定するClassifier 1、次に「審判がどのジェスチャーをしているか」を判定するClassifier 2です。双方とも画像から特徴を取り出し、SVM(Support Vector Machine、サポートベクターマシン)という古典的な分類器で判別しています。

田中専務

これって要するに審判が映っているかを先に見て、次にその姿勢を分類するということ?

AIメンター拓海

まさにその通りですよ。図で言えば入口で門番を置き、門番がOKを出したら中の専門チームがジェスチャーを判断する仕組みです。特徴量は深層畳み込みネットワークから抽出しますが、分類自体はSVMで行うという設計です。

田中専務

それは現場導入の目で見ると良さそうです。投資対効果の観点だと、どの部分が一番効果を生むのでしょうか。

AIメンター拓海

購入判断に使える観点を三つにまとめますね。第一にデータ準備のコスト、第二にモデルの誤検出(偽陽性/偽陰性)が業務に与える影響、第三にシステムの運用負荷です。これらを整理すれば、どの部分に人の手を残すかが見えてきますよ。

田中専務

実運用で誤認識が多いなら、人が最後にチェックする仕組みがいるわけですね。ところで、どんなデータを使ったんですか。

AIメンター拓海

研究ではSNOWという新しいデータセットを作っています。審判の五種類のポーズをラベル化した画像群で、学習には各ポーズ画像の80%を、評価には残り20%を用いています。特徴抽出はVGG19やInception V3などの既存ネットワークから行いました。

田中専務

なるほど。結局、現場で使えるかどうかは誤認識のパターンと検出精度次第ということですね。自分の言葉で言うと、まず審判がいるかを見つけてから、その仕草で重要シーンを切り出す流れで、誤検出は人がフォローする、という理解でよろしいですか。

AIメンター拓海

大丈夫、一緒にやれば必ずできますよ。要点を改めて三つにまとめます。第一に二段階検出(存在検出→姿勢分類)で無駄を減らすこと、第二に深層モデル由来の特徴量を用いてSVMで判別すること、第三に誤検出を補うための人の監視を残すことです。

田中専務

よく分かりました。ありがとうございます。それなら始めるときの優先順位が見えました。まずはデータ収集と、審判の有無を見分けるモデルの精度評価からですね。私はこうまとめます: 「審判が画面にいるかを検出してから、そのジェスチャーで重要シーンを自動抽出する。誤検出は人がチェックする。」これで社内会議に持っていきます。

監修者

阪上雅昭(SAKAGAMI Masa-aki)
京都大学 人間・環境学研究科 名誉教授

論文研究シリーズ
前の記事
NGC 4388におけるラム圧剥離の詳細解析
(The uneven sisters I: NGC 4388 – a strongly constrained ram pressure stripping event)
次の記事
LSTMとBi-LSTMを用いた血糖値予測の実務的意義
(Predicting Blood Glucose with an LSTM and Bi-LSTM Based Deep Neural Network)
関連記事
近似対称性を利用した効率的なマルチエージェント強化学習
(Exploiting Approximate Symmetry for Efficient Multi-Agent Reinforcement Learning)
都市型航空移動性における戦略的需要容量調整と学習ベース戦術的衝突回避を組み合わせた統合衝突管理
(Integrated Conflict Management for UAM with Strategic Demand Capacity Balancing and Learning-based Tactical Deconfliction)
公共ビデオカメラをゲーム化して社会的つながりを育む手法
(Love in Action: Gamifying Public Video Cameras for Fostering Social Relationships in Real World)
宇宙を学習システムとして
(The Universe as a Learning System)
EG-SpikeFormer: 視線誘導スパイクトランスフォーマー
(EG-SPIKEFORMER: EYE-GAZE GUIDED TRANSFORMER ON SPIKING NEURAL NETWORKS FOR MEDICAL IMAGE ANALYSIS)
Virgil に見る高赤方偏移極端源の実像:上昇する赤外線SEDと隠れたAGNの議論
この記事をシェア

有益な情報を同僚や仲間と共有しませんか?

AI技術革新 - 人気記事
ブラックホールと量子機械学習の対応
(Black hole/quantum machine learning correspondence)
生成AI検索における敏感なユーザークエリの分類と分析
(Taxonomy and Analysis of Sensitive User Queries in Generative AI Search System)
DiReDi:AIoTアプリケーションのための蒸留と逆蒸留
(DiReDi: Distillation and Reverse Distillation for AIoT Applications)

PCも苦手だった私が

“AIに詳しい人“
として一目置かれる存在に!
  • AIBRプレミアム
  • 実践型生成AI活用キャンプ
あなたにオススメのカテゴリ
論文研究
さらに深い洞察を得る

AI戦略の専門知識を身につけ、競争優位性を構築しませんか?

AIBR プレミアム
年間たったの9,800円で
“AIに詳しい人”として一目置かれる存在に!

プレミア会員になって、山ほどあるAI論文の中から効率よく大事な情報を手に入れ、まわりと圧倒的な差をつけませんか?

詳細を見る
【実践型】
生成AI活用キャンプ
【文部科学省認可】
満足度100%の生成AI講座
3ヶ月後には、あなたも生成AIマスター!

「学ぶ」だけではなく「使える」ように。
経営者からも圧倒的な人気を誇るBBT大学の講座では、3ヶ月間質問し放題!誰1人置いていかずに寄り添います。

詳細を見る

AI Benchmark Researchをもっと見る

今すぐ購読し、続きを読んで、すべてのアーカイブにアクセスしましょう。

続きを読む