2025.12.01

論文研究

9 分で読了

0 views

人間の嗜好スコアによるテキスト→画像モデルの調整

（Human Preference Score: Better Aligning Text-to-Image Models with Human Preference）

- メールで送る
- リンクをコピーする

AI戦略の専門知識を身につけ、競争優位性を構築しませんか？

AIBR プレミアム

年間たったの9,800円で

“AIに詳しい人”として
一目置かれる存在に！

プレミア会員になって、山ほどあるAI論文の中から効率よく大事な情報を手に入れ、まわりと圧倒的な差をつけませんか？

詳細を見る

【実践型】
生成AI活用キャンプ

【文部科学省認可】
満足度100%の生成AI講座

3ヶ月後には、
あなたも生成AIマスター！

「学ぶ」だけではなく「使える」ように。
経営者からも圧倒的な人気を誇るBBT大学の講座では、3ヶ月間質問し放題！誰1人置いていかずに寄り添います。

詳細を見る

田中専務

拓海先生、最近若い連中から「人の好みに合わせるスコアを作った論文がある」と聞きました。うちのデザインチームに関係ありますかね、具体的に何が変わるんでしょうか。

AIメンター拓海

素晴らしい着眼点ですね！一言で言えば「人が実際に好む画像」を機械的に測る仕組みを作った研究ですよ。現場でありがちな「見た目は良いけど人が違和感を覚える」問題を数値で捉えられるようにしたんです。

田中専務

なるほど。具体的にはどんなデータで学習するんですか。うちの現場で撮った写真で応用できますか。

AIメンター拓海

素晴らしい着眼点ですね！その研究は実際の人間の選択を集めたデータセットを使っています。Discord上で生成画像に対する人間の好みを収集し、それを基に画像と言語を結びつけるモデルを微調整しているんです。要は現場データで再学習すれば、社内写真でも使えるようになりますよ。

田中専務

これって要するに、人間が好む画像を測るスコアを作ったということ？投資対効果で考えると初期コストを抑えられるのか知りたいのですが。

AIメンター拓海

その通りです。結論から言うと、効果が見込める割に実装は比較的シンプルです。要点を三つにまとめると、1) 人の選好を数値化するスコアを学習する、2) 既存の画像生成モデルにそのスコアでガイドをかける、3) 少量の社内データで最適化できる、です。導入段階は小さく始めて段階的に拡大できますよ。

田中専務

技術的にはCLIPって言うのを使っていると聞きましたが、それは何でしょうか。専門的すぎて説明してもらわないと分かりません。

AIメンター拓海

素晴らしい着眼点ですね！CLIPは正式にはContrastive Language–Image Pretraining（CLIP）と呼ばれるモデルで、画像と言葉を同じ空間に落とし込む役割を持ちます。身近な例で言えば、写真と説明文を同じ「共通の意味空間」に置いて、どれが合っているかを測る道具です。ここを微調整して「人が好む」方向を強めたのが本研究ですから、応用可能性が高いんです。

田中専務

運用面ではどんなリスクや限界がありますか。現場で想定されるトラブルを知っておきたいです。

AIメンター拓海

いい質問です。注意点は主に三つです。第一に偏りのあるデータから学ぶと「偏った好み」になってしまう点、第二に外見的に好ましくないが重要な情報を削ってしまう可能性、第三に悪用や著作権的な扱いの問題です。これらは運用ルールと段階的な評価で管理できますよ。

田中専務

現場で段階的に始めるとして、まず何をすれば投資が無駄になりませんか。短期間で効果を確認する手順はありますか。

AIメンター拓海

素晴らしい着眼点ですね！短期で試すなら、まず少数の重要プロンプトで生成画像を作り、人手で好みをラベル付けすることです。それを使って人間嗜好スコアを学習し、生成モデルに反映させて改善率をA/Bテストすれば、効果が見える化できます。小さく始めて成功事例を増やせば拡張も容易ですよ。

田中専務

わかりました、では最後に私の言葉で整理してみます。人の好みを学習して生成画像を選べるようにする仕組みを作り、小さく試して効果を確かめてから拡大する、という流れで合っていますか。

AIメンター拓海

その通りですよ。大丈夫、一緒にやれば必ずできますよ。

1.概要と位置づけ

結論から述べる。本研究の最も大きな示唆は、従来の自動評価指標だけでは捉えられなかった「人間の好み（human preference）」を明示的に学習して数値化し、その数値を生成モデルの制御に組み込むことで、生成結果を人間の期待に近づけられる点である。既存の指標であるInception Score（IS）、Fréchet Inception Distance（FID）、CLIPスコアといった自動評価値は、画質や多様性の側面は評価できるが、人間が選ぶ「好み」とは乖離する場合がある。そこで本研究は実際の人間の選好を収集し、それを教師信号としてCLIP（Contrastive Language–Image Pretraining）モデルを微調整し、人間嗜好スコア（Human Preference Score, HPS）を定義した。HPSは画像とプロンプトの適合度を人間の選択に合わせて評価するものであり、生成モデルの方針決定に直接利用できる点が本研究の革新性である。結果として、従来は自動指標で高評価でも人間には違和感が残った出力が、人間嗜好に沿って改善されることが示されている。

2.先行研究との差別化ポイント

先行研究は主に生成モデルの出力を画質や分布類似性で評価してきた。Inception Score（IS）は生成画像の分類確信度と多様性を測り、Fréchet Inception Distance（FID）は生成分布と実データ分布の類似性を数値化する。CLIPスコアは画像とテキストの整合性を測る自動指標であるが、これらはいずれも「人間がその画像を好むか否か」という判断軸を直接には含まない。本研究はこのギャップを埋めるために、人間の実際の選択データを収集し、好ましい画像と好ましくない画像の違いを学習した点で差別化する。さらに差異は実装面にも及ぶ。具体的には、HPSを計算するためにCLIPを微調整し、さらにStable Diffusionのような拡散モデルに対してLoRA（Low-Rank Adaptation）で嗜好を反映させることで、実運用に耐える微調整手法を提示している。要するに自動指標を補完する「人間の評価軸」を作り、それを生成パイプラインに組み込む点が本研究の独自性である。

3.中核となる技術的要素

技術の核は二つある。第一はHuman Preference Score（HPS）の設計で、これは微調整されたCLIPの画像エンコーダとテキストエンコーダのコサイン類似度を100倍して可視化したものである。このスコアは単なる類似度ではなく、人間の選択に合わせて学習された重みを内包しているため、従来のCLIPスコアと比較して人間の好みに一致しやすい。第二は生成モデルへの適用方法である。Stable Diffusionのような拡散モデルに対しては、生成時の制御をLoRA（Low-Rank Adaptation）で行い、好ましくない概念をプロンプト接頭辞（Identifier）で識別して学習させる。推論時にはそのIdentifierをネガティブプロンプトとして用いることで、生成器が非好ましい表現を避けるよう誘導する。これらの組合せにより、モデルのキャパシティを大きく変えずに嗜好に沿った出力へ導けることが技術的メリットである。

4.有効性の検証方法と成果

有効性の検証は主にユーザースタディと自動指標の比較で行われた。まずDiscord上で集めた実際の人間選択データを訓練に用い、HPSを計算する分類器を作成した。それを用いて生成した画像群と従来手法で得られた画像群を人間評価で比較した結果、HPSでガイドしたモデルの方が有意に人間の選好に合致した。加えてISやFID、従来のCLIPスコアとの相関を調べると、これらの指標が必ずしも人間の選択と高相関ではないことが示された。生成モデルをLoRAで適応させた実験では、見た目の自然さを保ちながら人間嗜好に基づいた改善が確認され、実用面での有用性が示されている。

5.研究を巡る議論と課題

議論点は主にデータの偏り、一般化能力、倫理面に集約される。まず学習に使ったデータが特定のコミュニティ由来である場合、その好みが一般集団を代表しないリスクがある。次に、HPSが異なるドメインや文化圏でどの程度一般化するかは未解決であり、追加のデータ収集やクロスドメイン評価が必要である。さらに、好みに合わせる過程で多様性や重要な情報が失われる可能性、あるいは著作権や肖像権に関わる問題が生じうるため、運用ルールと倫理的ガイドラインの整備が必須である。これらの課題は技術的な改良と組織的なガバナンスを併せて進めることで対応する必要がある。

6.今後の調査・学習の方向性

今後は三つの方向が重要である。第一にデータのスケールと多様性を拡大し、HPSの偏りを減らすこと。第二にHPSを生成モデルに組み込む際の最適化手法を精緻化し、トレードオフ（多様性と好みの平衡）を定量化すること。第三に実運用に向けて透明性や説明可能性を高め、倫理的なチェックポイントを導入することが求められる。検索に使えるキーワードは以下が有用である：”Human Preference Score”, “HPS”, “CLIP fine-tuning”, “Stable Diffusion LoRA”, “human-in-the-loop image generation”。企業の実務としては、まず小規模なA/Bテストから始めて内部評価を蓄積し、ポリシーと合わせた運用フローを作ることを推奨する。

会議で使えるフレーズ集

「本件は人間の選好を直接数値化した点が差分です。まず小さなスコープで効果を検証しましょう。」

「指標だけでは見えない『人が好むか』を評価軸に加えることで、顧客受けが改善できるはずです。」

「初期投資は限定的で、社内の代表的なプロンプトを使ったA/Bテストで効果確認を行いませんか。」

X. Wu et al., “Human Preference Score: Better Aligning Text-to-Image Models with Human Preference,” arXiv preprint arXiv:2303.14420v2, 2023.

PCも苦手だった私が

“AIに詳しい人“
として一目置かれる存在に！

論文研究

人間の嗜好スコアによるテキスト→画像モデルの調整

さらに深い洞察を得る

AIBR プレミアム

“AIに詳しい人”として
一目置かれる存在に！

【実践型】
生成AI活用キャンプ

3ヶ月後には、
あなたも生成AIマスター！

1.概要と位置づけ

2.先行研究との差別化ポイント

3.中核となる技術的要素

4.有効性の検証方法と成果

5.研究を巡る議論と課題

6.今後の調査・学習の方向性

会議で使えるフレーズ集

論文研究シリーズ

AI技術革新 - 人気記事

“AIに詳しい人“
として一目置かれる存在に！

あなたにオススメのカテゴリ

さらに深い洞察を得る

AIBR プレミアム

“AIに詳しい人”として一目置かれる存在に！

【実践型】
生成AI活用キャンプ

3ヶ月後には、あなたも生成AIマスター！

人間の嗜好スコアによるテキスト→画像モデルの調整

さらに深い洞察を得る

AIBR プレミアム

“AIに詳しい人”として一目置かれる存在に！

【実践型】 生成AI活用キャンプ

3ヶ月後には、あなたも生成AIマスター！

1.概要と位置づけ

2.先行研究との差別化ポイント

3.中核となる技術的要素

4.有効性の検証方法と成果

5.研究を巡る議論と課題

6.今後の調査・学習の方向性

会議で使えるフレーズ集

論文研究シリーズ

関連記事

この記事をシェア

AI技術革新 - 人気記事

“AIに詳しい人“として一目置かれる存在に！

あなたにオススメのカテゴリ

さらに深い洞察を得る

AIBR プレミアム

“AIに詳しい人”として一目置かれる存在に！

【実践型】 生成AI活用キャンプ

3ヶ月後には、あなたも生成AIマスター！

AI Benchmark Researchをもっと見る

“AIに詳しい人”として
一目置かれる存在に！

【実践型】
生成AI活用キャンプ

3ヶ月後には、
あなたも生成AIマスター！

“AIに詳しい人“
として一目置かれる存在に！

【実践型】
生成AI活用キャンプ