
拓海先生、最近部下が推薦アルゴリズムの論文を持ってきましてね。『コンフォーミティを考慮したマルチタスクランキング』というやつです。正直、何が問題で何が新しいのか、私にはピンと来ないんです。

素晴らしい着眼点ですね!簡単に言えば、利用者が何を本当に欲しているかと、『みんなが見ているから合わせて見る行動(コンフォーミティ)』を分けて考えられるモデルです。一緒に噛み砕いていきましょう。

なるほど。で、それを我が社のような中小のサービスに導入すると、要するに何が変わるんですか?投資対効果が知りたいのです。

結論を先に言うと、ユーザーの「真の興味」に基づく推薦が増えれば、長期的な利用者満足とエンゲージメントが改善しますよ。ポイントは三つです。まず、人気に流されて表示されるだけの項目を減らせる。次に、個別の興味に沿った多様性が増える。最後に、短期の誤誘導を減らせる。大丈夫、一緒にやれば必ずできますよ。

設計上のポイントは何でしょうか。現場のエンジニアは既にマルチタスク学習を使っていると言っていますが、それと何が違うのですか。

ここが肝です。単なるマルチタスク学習(multi-task learning, MTL)は複数目的を同時に最適化しますが、CAM2は『コンフォーミティ(conformity)=流行に合わせる行動』を明示的にモデル化して分離します。つまり入力特徴を分割し、補助的な損失でそれぞれを独立に学ばせるのです。例えるなら、売上と顧客満足を分けて管理するようなものですよ。

これって要するに、人気のアイテムに釣られて見ているだけのユーザー行動と、本当に興味がある行動を切り分けるということ?そうなら納得できます。

その通りですよ。で、運用面で何を気にしたらよいかも三点で整理します。第一に、特徴をどう分割するか。第二に、補助損失の重み付け。第三に、オンラインでの評価指標の選び方。これを順を追って試すだけで、導入リスクは低くできますよ。

具体的な効果はどの程度見込めるのですか。0.1%とかで投資回収が怪しくなると聞いていますが。

論文ではFacebook Watchの実運用で、集約されたユーザーエンゲージメントが0.50%増加し、日次アクティブユーザーが0.21%増加したと報告しています。小さな割合に見えて、数千万ユーザー規模では大きな価値ですよ。まずはPBテストで影響度合いを検証しましょう。大丈夫、一緒にやれば必ず結果は見えますよ。

分かりました。まずは小さく試して、効果が出れば拡張する。これなら現場の負担も抑えられそうです。それでは私の言葉でまとめます。『CAM2は流行に引っ張られる表示を減らし、本当に興味のある項目を出す設計で、実運用でエンゲージメント向上が確認できる。まずは実験で効果を確かめる』──こんな感じで合っていますか。
