
拓海先生、最近部下から「ゲームのログ解析で顧客離脱(churn)を予測できます」と言われまして、正直ぴんと来ないのです。これって要するに売上を守るために誰が辞めそうか見つける、ということですか?

素晴らしい着眼点ですね!その通りです。ゲームのログから誰が離れるかを予測すれば、退会を防ぐ施策にピンポイントで投資できますよ。大丈夫、一緒に見ていけば必ずわかりますよ。

実際にどんなデータを使うのですか。うちの工場もセンサーはあるけれど、個人情報の扱いとか心配で……

心配は当然です。今回の研究では、ゲーム内の行動ログという匿名化された大量データを用いています。ポイントは三つで、データの量、離脱を定義するラベル、予測の評価指標です。これらをきちんと設計すれば実務に応用できますよ。

なるほど。で、効果があるかどうかはどうやって示すのですか。ROIの説明ができないと投資決裁が下りないんです。

そこも重要です。研究では予測精度や生存分析の統計的検定で有効性を示しています。実務では精度だけでなく、値上がりしやすい顧客層や介入コストを掛け合わせて期待値を算出しますよ。短くまとめると、データで”誰に何をすれば収益が守れるか”を示すことです。

技術面では特別なことをやっているのですか。深層学習(Deep Learning)とか、そういう単語を若手が言ってますが。

若手の言う通り、深層学習やアンサンブル木(ensemble tree)などの最先端手法が使われています。ただし、最大のポイントは特徴量エンジニアリングです。言い換えれば、ログをどう整理してビジネスに結びつけるかが肝です。簡単に言うと、道具より使い方ですね。

これって要するに、良いデータを渡してあげれば外部の人間でも意味のある予測ができる、ということですか?

その通りです。今回の研究は商用データを公開してベンチマークを作ることで、外部研究者の創意工夫を引き出しました。これが産業界にとって大きな一歩であり、同様の公開が増えれば業界全体の知見が早く育ちますよ。

分かりました。自分の言葉で言うと、「匿名化した大量ログを公開して外部の手法で検証することで、誰に手を打つべきかの根拠が得られる」ということですね。やってみる価値はありそうです。


