公平性のためのテキスト→画像拡散モデルのファインチューニング（FINETUNING TEXT-TO-IMAGE DIFFUSION MODELS FOR FAIRNESS）

田中専務

拓海先生、最近社内で「生成AIの画像が偏っている」と言われまして。これ、本当に問題になるんでしょうか。

AIメンター拓海

素晴らしい着眼点ですね！社会で多く使われるテキスト→画像モデルが特定の性別や人種に偏った像を出すと、企業イメージやサービスの公正性に影響しますよ。

田中専務

うちも商品画像生成にAIを使う案があるんですが、もし偏っていたら取引先や社員の反発もあり得ると。具体的にどう直せるんですか。

AIメンター拓海

大丈夫、一緒にやれば必ずできますよ。今回の手法は「生成画像の分布をユーザーが望む目標分布に合わせる」ことが柱で、二つの技術的柱で実現しています。

田中専務

二つ、ですか。要するにどんな選択肢があるか、ざっくり教えてください。

AIメンター拓海

一つは生成画像の特性を直接そろえる「分布整合（distributional alignment）損失」です。もう一つはサンプリング過程を直接微調整する「調整済み直接ファインチューニング（adjusted direct finetuning）」です。要点は三つで説明しますね。

田中専務

これって要するに、生成画像の偏りをユーザーが望む分布に合わせるということ？導入コストはどれくらいですか。

AIメンター拓海

まさにその通りですよ。要点は一、目標の分布を設定できること。二、サンプリング工程を直接改善することで効率よく効果を出せること。三、少数の追加トークンだけでも性別バイアスはかなり改善できることです。

田中専務

少ない手間で効果が出るのは良いですね。実践で気をつける点はありますか、現場に落とし込めますか。

AIメンター拓海

安心してください。現場導入の要点も三つです。目標分布の合意形成、評価の自動化、そして複数概念の同時デバイアスです。特に評価は現場データで回すことが重要ですよ。

田中専務

分かりました。これなら社内の理解も得やすそうです。要するに、生成の出力を狙って変えていくことで公平性を担保するという理解で合っていますか。自分の言葉で言うと、AIが出す画像の偏りを会社が望む割合に合わせて“調整”する仕組み、ということですね。

飽和出力観測下における漸近的効率的適応同定（Asymptotically Efficient Adaptive Identification under Saturated Output Observation）