
拓海先生、最近うちの若手が「時系列データの平均が信用できない」と騒いでまして、DTWとかいう言葉が出てきて頭が痛いです。要点を簡単に教えてくださいませんか。

素晴らしい着眼点ですね!大丈夫、一緒に整理しましょう。今回の論文は「DTW(Dynamic Time Warping=動的時間伸縮)」を使って作る平均の問題点を見直したものですよ。

DTWって言葉だけでもう尻込みします。要するに、時間軸のズレを吸収して似ている波形を比べるための技術だと聞いていますが、それで平均を取ると何が問題なのですか。

素晴らしい着眼点ですね!まず本質を三つにまとめます。1) DTWは時間の伸縮を許して比較する距離であること、2) そこで定義する平均の概念が通常のユークリッド平均と違うこと、3) 以前の主張では「平均が不正確になるのは三角不等式の欠如が原因」とされていたが、それを疑問視している点です。

これって要するに、時間軸を伸ばしたり縮めたりして合わせる手法のせいで、「代表」としての平均がぶれるという話ですか。そこをどう論文は切り込んだのですか。

良い整理ですね!論文はまず既存の「正当性基準(correctness-criterion)」と「ドリフトアウト(drift-out)」という概念を検討しています。そして、その一部は定義や幾何学的解釈に問題があり、また三角不等式の有無だけで説明できないと示しています。

正当性基準やドリフトアウトが定義から怪しいと。うーん、定義がおかしいと結論も揺らぎますよね。それで実務上の影響はどの程度あるのですか。

その通りです。結論としては、実務では「既存手法が全て使えない」と断じるのは早計であり、むしろ平均の定義を「フレシェ平均(Fréchet mean=Fréchet平均)」の最小化視点で考えると、サンプル平均に当たる真の解はドリフトアウトしないことが示されます。

フレシェ平均ですか。難しそうですね。要するに「ある評価指標を最小にする代表」をちゃんと考えればいい、ということですか。

その通りですよ。素晴らしい着眼点ですね!経営目線では三つポイントです。1) 代表値の定義を明確にすること、2) 近似手法(例: DBAやSSG)がどの程度真の最小化解に接近するかを評価すること、3) 実運用では評価軸を業務目的に合わせて設計すること、です。

なるほど。結局は「手法が悪い」のではなく「何をもって良しとするか」が曖昧だったということですね。これなら現場に説明しやすいです。

素晴らしい着眼点ですね!その理解で十分に運用できるはずです。大丈夫、一緒にプロジェクト設計すれば必ずできますよ。まずは評価軸を一つ定めて、既存の近似法がそこにどれだけ合致するかを実証することから始めましょう。

分かりました。まずは「目で見て代表を確認できる指標」を作って、近似法がその指標で許容範囲か確かめる。これって要するに、技術的には慎重に評価軸を決めてから導入する、ということですね。

まさにその通りです。要点を三つだけ復唱します。1) 代表値の定義を明確にする、2) 近似法の品質をその定義で評価する、3) 必要なら真の最小化解に近づける改善を検討する。大丈夫、一緒にやれば必ずできますよ。

分かりました。自分の言葉で言うと、「DTWで平均を取るときは、何を『平均』とみなすかを最初に決めて、それに合わせて近似法の精度を評価しないと誤解が生じる」ということですね。これで部下にも説明できます。


