4 分で読了
0 views

動画理解のための柔軟な3D CNNアクセラレータ

(Morph: Flexible Acceleration for 3D CNN-based Video Understanding)

さらに深い洞察を得る

AI戦略の専門知識を身につけ、競争優位性を構築しませんか?

AIBR プレミアム
年間たったの9,800円で
“AIに詳しい人”として
一目置かれる存在に!

プレミア会員になって、山ほどあるAI論文の中から効率よく大事な情報を手に入れ、まわりと圧倒的な差をつけませんか?

詳細を見る
【実践型】
生成AI活用キャンプ
【文部科学省認可】
満足度100%の生成AI講座
3ヶ月後には、
あなたも生成AIマスター!

「学ぶ」だけではなく「使える」ように。
経営者からも圧倒的な人気を誇るBBT大学の講座では、3ヶ月間質問し放題!誰1人置いていかずに寄り添います。

詳細を見る

田中専務

拓海先生、最近うちの現場で「動画解析」にAIを使えないかと。ですが、画像と動画で何がそんなに違うのか、正直ピンと来ないのです。

AIメンター拓海

素晴らしい着眼点ですね!動画は時間軸という次元が加わり、処理量が飛躍的に増えますよ。大丈夫、一緒に整理していけばできますよ。

田中専務

時間軸が増えると何が困るんですか?メモリが増えるとか、処理が遅くなるという話は部下も言ってますが。

AIメンター拓海

端的に言うとその通りです。画像向けのConvolutional Neural Networks (CNNs)(畳み込みニューラルネットワーク)は主に空間情報を扱いますが、動画では3D Convolutional Neural Networks (3D CNNs)(3次元畳み込みニューラルネットワーク)として時間方向の情報も同時に扱うため、計算量とメモリ要求が大きくなるんですよ。

田中専務

それをハードでどうにかする、という話だと聞きました。要するに専用の回路を作ればいいということですか?

AIメンター拓海

その方向性は正しいです。ただ重要なのは『柔軟性』です。動画モデルはレイヤーごとに最適な処理形態が変わるので、一つの固定設計だけでは投資対効果が下がるんです。

田中専務

これって要するに、作業に合わせて機械の“設定”を変えられるようにしておくのが肝心、ということですか?

AIメンター拓海

まさにその通りですよ。要点を三つで言うと、1) 動画は時間次元でコストが増える、2) レイヤーごとに最適化パラメータが違う、3) ソフト側で最適設定を見つけてハードに反映することが重要、です。

田中専務

投資対効果の面で心配なのは、柔軟な回路は高くつかないかという点です。現場の設備投資の判断に直結します。

AIメンター拓海

ご懸念は的確です。ここでも三点で整理します。1) 柔軟性のコストは限定的に設計できる、2) ソフトと併せて最適化することでエネルギー効率が大幅に改善する、3) 長期的には稼働率の向上で回収可能になる、です。

田中専務

具体的にはどんな“柔軟性”があればいいんでしょうか。現場のオペレーションに近い例で教えてください。

AIメンター拓海

現場の例で言えば、同じ工場で複数の製品を生産する場合に機械を段取り替えするのと似ています。具体的にはタイルサイズ(データの分割単位)、計算順序、並列度などをレイヤーごとに変えられることが重要なんです。

田中専務

なるほど。最後に一つだけ確認したいのですが、導入判断の際に経営者として見るべき指標を教えてください。

AIメンター拓海

要点は三つです。1) 性能当たりの消費電力(performance per watt)、2) レイヤーやモデルの多様性に対する柔軟性、3) ソフトウェアで設定を最適化できるエコシステムがあるか、です。これらが揃っていれば投資対効果は見込みやすいですよ。

田中専務

分かりました。わたしの言葉で整理すると、動画解析に向けては「可変設定で効率化する専用機」と「設定を探すソフト」の両方が必要で、導入可否は消費電力効率と柔軟性、ソフトの成熟度を見る、ということですね。

監修者

阪上雅昭(SAKAGAMI Masa-aki)
京都大学 人間・環境学研究科 名誉教授

論文研究シリーズ
前の記事
品質重視の無線ビデオ伝送における深層学習を用いた送信電力制御
(Deep Learning Based Power Control for Quality-Driven Wireless Video Transmissions)
次の記事
ニュートン・スキーム:運動法則を深層学習に組み込む手法
(The Newton Scheme for Deep Learning)
関連記事
ヘテロジニアスグラフニューラルネットワーク改善のための事後学習フレームワーク
(A Post-Training Framework for Improving Heterogeneous Graph Neural Networks)
教育向け個別学習パス設計
(Educational Personalized Learning Path Planning with Large Language Models)
複数の保護属性に対する公平性改善はどこまで効果があるか
(Fairness Improvement with Multiple Protected Attributes: How Far Are We?)
能動的優位整合型オンライン強化学習
(Active Advantage-Aligned Online Reinforcement Learning)
上位k識別のための反対相関サンプリング
(Antithetic Sampling for Top-k Shapley Identification)
Planck 2018が残した宇宙論の遺産
(Planck 2018 results. I. Overview and the cosmological legacy of Planck)
関連タグ
この記事をシェア

有益な情報を同僚や仲間と共有しませんか?

AI技術革新 - 人気記事
ブラックホールと量子機械学習の対応
(Black hole/quantum machine learning correspondence)
生成AI検索における敏感なユーザークエリの分類と分析
(Taxonomy and Analysis of Sensitive User Queries in Generative AI Search System)
DiReDi:AIoTアプリケーションのための蒸留と逆蒸留
(DiReDi: Distillation and Reverse Distillation for AIoT Applications)

PCも苦手だった私が

“AIに詳しい人“
として一目置かれる存在に!
  • AIBRプレミアム
  • 実践型生成AI活用キャンプ
あなたにオススメのカテゴリ
論文研究
さらに深い洞察を得る

AI戦略の専門知識を身につけ、競争優位性を構築しませんか?

AIBR プレミアム
年間たったの9,800円で
“AIに詳しい人”として一目置かれる存在に!

プレミア会員になって、山ほどあるAI論文の中から効率よく大事な情報を手に入れ、まわりと圧倒的な差をつけませんか?

詳細を見る
【実践型】
生成AI活用キャンプ
【文部科学省認可】
満足度100%の生成AI講座
3ヶ月後には、あなたも生成AIマスター!

「学ぶ」だけではなく「使える」ように。
経営者からも圧倒的な人気を誇るBBT大学の講座では、3ヶ月間質問し放題!誰1人置いていかずに寄り添います。

詳細を見る

AI Benchmark Researchをもっと見る

今すぐ購読し、続きを読んで、すべてのアーカイブにアクセスしましょう。

続きを読む