4 分で読了
1 views

視覚的直感物理理解のベンチマーク:IntPhys 2019

(IntPhys 2019: A Benchmark for Visual Intuitive Physics Understanding)

さらに深い洞察を得る

AI戦略の専門知識を身につけ、競争優位性を構築しませんか?

AIBR プレミアム
年間たったの9,800円で
“AIに詳しい人”として
一目置かれる存在に!

プレミア会員になって、山ほどあるAI論文の中から効率よく大事な情報を手に入れ、まわりと圧倒的な差をつけませんか?

詳細を見る
【実践型】
生成AI活用キャンプ
【文部科学省認可】
満足度100%の生成AI講座
3ヶ月後には、
あなたも生成AIマスター!

「学ぶ」だけではなく「使える」ように。
経営者からも圧倒的な人気を誇るBBT大学の講座では、3ヶ月間質問し放題!誰1人置いていかずに寄り添います。

詳細を見る

田中専務

拓海さん、最近うちの若手が「IntPhysってベンチマークが重要だ」と騒いでましてね。正直どこから手を付ければいいのか分からなくて、要点だけ教えていただけますか。

AIメンター拓海

素晴らしい着眼点ですね!IntPhys 2019は映像を使って機械の「直感的物理理解」を測るベンチマークです。要点を三つで言うと、可能な出来事と不可能な出来事を見分けるテスト、映像全体に対する妥当性スコアの出力が必要、そしてテストは偏りを抑えて設計されている点です。大丈夫、一緒にやれば必ずできますよ。

田中専務

なるほど。で、それを使うメリットは何でしょうか。うちの現場でROIが出るかどうかが知りたいんです。

AIメンター拓海

素晴らしい視点ですね!ROIの観点では三点に整理できます。第一に、直感的物理理解が改善すれば現場カメラの異常検知やシミュレーションの精度が上がり、故障予兆や設計検証の自動化につながります。第二に、偏りを抑えた比較テストなのでモデルの弱点が明確になり、無駄な投資を避けられます。第三に、既存映像データで自己教師あり学習ができるため、大量ラベル付けのコストを抑えられますよ。

田中専務

自己教師あり学習というのは聞いたことがありますが、要するに人手のラベル付けを減らして機械が自分で学ぶということですか?

AIメンター拓海

素晴らしい着眼点ですね!その通りです。自己教師あり学習(self-supervised learning)では、未来フレームの予測や物体のマスク予測などを目標にして、教師ラベルを与えなくても多くの映像情報から学べます。身近な例で言うと、パズルの一部を隠して残りから推測する訓練を繰り返すようなイメージですよ。

田中専務

実際にどうテストするのかイメージが湧きません。映像で可能・不可能を並べるとありますが、専門家が作るんですか。

AIメンター拓海

素晴らしい疑問ですね!IntPhysではゲームエンジンで「物理的にあり得る映像」と「物理法則に反する映像」を非常に良くマッチする対で作成します。これをモデルに見せて、各映像に対して妥当性(plausibility)スコアを出させて比較するのです。そのため評価は偏りが少なく、モデルが本当に物理を理解しているかを診断できますよ。

田中専務

これって要するに、うちの監視カメラが「おかしな動き」を人間と同じように見抜けるかを数値で確かめられる、ということですか?

AIメンター拓海

素晴らしい要約ですね!まさにその通りです。現場で言えば、部品が浮いて見える、重力に反する動きがある、接触があり得ないのにものが通り抜ける、といった「人ならすぐ不自然だと気づく事象」をモデルが検出できるかを確かめる仕組みです。一緒に段階的に導入計画を作れば、リスクを抑えつつ効果を測れますよ。

田中専務

分かりました。まずは既存の映像データで自己教師あり学習を試して、次にIntPhys的なテストでモデルを評価し、そこから現場ルールに合わせて調整する流れで進めてみます。ありがとうございました、拓海さん。

AIメンター拓海

素晴らしい意思決定ですね!その順序で進めれば投資対効果が見える化できますし、失敗しても学習の蓄積になります。何かあれば私がサポートしますので、大丈夫、一緒にやれば必ずできますよ。

監修者

阪上雅昭(SAKAGAMI Masa-aki)
京都大学 人間・環境学研究科 名誉教授

論文研究シリーズ
前の記事
複雑語識別にカーネル学習を用いる方法
(UnibucKernel: A kernel-based learning method for complex word identification)
次の記事
プログラム的弱い教師あり学習によるマルチエージェント軌跡生成
(Generating Multi-Agent Trajectories Using Programmatic Weak Supervision)
関連記事
M3Netによる自動運転のマルチモーダル・マルチタスク認識革新
(M3Net: Multimodal Multi-task Learning for 3D Detection, Segmentation, and Occupancy Prediction in Autonomous Driving)
欠損部品のための効率的コンテキストベース形状検索
(PReP: Efficient context-based shape retrieval for missing parts)
CPRMによる商用検索における関連性モデリングのための継続的事前学習フレームワーク
(CPRM: A LLM-based Continual Pre-training Framework for Relevance Modeling in Commercial Search)
小規模太陽磁場要素の速度測定
(Velocities Measured in Small Scale Solar Magnetic Elements)
変換器は問題を再帰的に解けるか?
(Can Transformers Learn to Solve Problems Recursively?)
データ不足下のグラフマイニング
(Graph Mining under Data scarcity)
この記事をシェア

有益な情報を同僚や仲間と共有しませんか?

AI技術革新 - 人気記事
ブラックホールと量子機械学習の対応
(Black hole/quantum machine learning correspondence)
生成AI検索における敏感なユーザークエリの分類と分析
(Taxonomy and Analysis of Sensitive User Queries in Generative AI Search System)
DiReDi:AIoTアプリケーションのための蒸留と逆蒸留
(DiReDi: Distillation and Reverse Distillation for AIoT Applications)

PCも苦手だった私が

“AIに詳しい人“
として一目置かれる存在に!
  • AIBRプレミアム
  • 実践型生成AI活用キャンプ
あなたにオススメのカテゴリ
論文研究
さらに深い洞察を得る

AI戦略の専門知識を身につけ、競争優位性を構築しませんか?

AIBR プレミアム
年間たったの9,800円で
“AIに詳しい人”として一目置かれる存在に!

プレミア会員になって、山ほどあるAI論文の中から効率よく大事な情報を手に入れ、まわりと圧倒的な差をつけませんか?

詳細を見る
【実践型】
生成AI活用キャンプ
【文部科学省認可】
満足度100%の生成AI講座
3ヶ月後には、あなたも生成AIマスター!

「学ぶ」だけではなく「使える」ように。
経営者からも圧倒的な人気を誇るBBT大学の講座では、3ヶ月間質問し放題!誰1人置いていかずに寄り添います。

詳細を見る

AI Benchmark Researchをもっと見る

今すぐ購読し、続きを読んで、すべてのアーカイブにアクセスしましょう。

続きを読む