
拓海先生、最近部署で『AIで推薦を公平にしろ』って言われて困ってます。何を相談すればいいのか、そもそも何が問題なのかが分かりません。

素晴らしい着眼点ですね!大丈夫、順を追って整理すれば見えてきますよ。まずは”何を選ぶか”と”誰にとってどう見えるか”を分けて考えましょう。

なるほど。推薦や検索で『選ぶ』部分が問題になる、ということですか。具体的にはどのような指標を見れば良いのでしょうか。

ポイントは三つです。第一に多様性(diversity and inclusion、D&I、多様性と包摂)を見ること。第二に誰がその多様性を感じるか、つまり含まれているかを評価すること。第三にそれを現場で使える形にすることです。

それは現場でどう測りますか。工場のラインでは数字がないと説得できません。測れる指標が必要です。

そこがまさに本論文の肝です。subset selection(SS、部分集合選択)で選ばれた集合に対して、多様性を定量化する指標と、包摂(inclusion)を定量化する指標を分けて提示しています。実験で人の評価と照合もしていますよ。

これって要するに、選ぶ結果の『色々さ』と『その人が帰属感を持てるか』を別々に数値化する、ということですか?

まさにその通りです!素晴らしい着眼点ですね。要点を三つにまとめると、1) 多様性は属性の分散やカバレッジで測る、2) 包摂は少数派が十分に代表されるかで測る、3) 社会選択理論(social choice theory、社会選択理論)で集合を決める仕組みを組み込める、です。

社内で導入するとき、現場の負担はどれくらいでしょう。データ整備や評価の運用コストを懸念しています。

重要な点ですね。現実的には三段階で進めます。まず小さなパイロットで属性データの必要最小限を集める。次に指標を簡易ダッシュボードで出す。最後に業務ルールに落とし込む。初期投資はあるが長期的なリスク軽減になるはずです。

それなら投資対効果を説明できます。最後に確認ですが、我々がやるべき第一歩は何でしょうか。

大丈夫、一緒にやれば必ずできますよ。まず我々がすべきは現状の出力をサンプル化して、誰が含まれていないかを可視化することです。次に簡易的な多様性指標と包摂指標を作り、経営判断に使える形に整えます。

分かりました。私の言葉でまとめますと、まず出力を見える化して、色々な属性がきちんと含まれているかと、含まれている人が『場に居場所を感じるか』を分けて測る。という理解で間違いないでしょうか。
