4 分で読了
0 views

公平性の嗜好は誰のものか? 人間のフィードバックとAIの公平性への影響

(Whose Preferences? Differences in Fairness Preferences and Their Impact on the Fairness of AI Utilizing Human Feedback)

さらに深い洞察を得る

AI戦略の専門知識を身につけ、競争優位性を構築しませんか?

AIBR プレミアム
年間たったの9,800円で
“AIに詳しい人”として
一目置かれる存在に!

プレミア会員になって、山ほどあるAI論文の中から効率よく大事な情報を手に入れ、まわりと圧倒的な差をつけませんか?

詳細を見る
【実践型】
生成AI活用キャンプ
【文部科学省認可】
満足度100%の生成AI講座
3ヶ月後には、
あなたも生成AIマスター!

「学ぶ」だけではなく「使える」ように。
経営者からも圧倒的な人気を誇るBBT大学の講座では、3ヶ月間質問し放題!誰1人置いていかずに寄り添います。

詳細を見る

田中専務

拓海先生、最近うちの部下が「人の判断を学習させればAIの公平性が上がる」と言うのですが、本当に全員にとって公平になるのですか。

AIメンター拓海

素晴らしい着眼点ですね!結論から言えば、人のフィードバックは万能ではなく、誰の嗜好を学ぶかでAIの振る舞いが変わるんですよ。

田中専務

それは困ります。うちが導入してしまったら、特定の年齢層や政治的立場に偏った判断をするようになったらどうするのですか。

AIメンター拓海

大丈夫、一緒に整理しましょう。論文ではHuman Feedback (HF) 人間のフィードバックを得て、どのようにFairness(公正性)を学習するかを調べていますよ。

田中専務

これって要するに、どのグループからフィードバックを取るかでAIの判断が変わるということですか?

AIメンター拓海

その通りです。重要なポイントを三つに分けて説明しますね。第一、あるデモグラフィックの嗜好が集中的に反映されると、そのグループに寄った判定になること。第二、異なるグループごとに学習モデルを作ると評価値が変わること。第三、複数モデルの合議で性能が改善する可能性があることです。

田中専務

具体的にはどんな実験をしたのですか。誰が回答したかによってラベルが違うということですか。

AIメンター拓海

はい。研究者はオンラインのクラウドソーシングから多様な回答者を集め、同じ文の組を提示してどちらがより不適切か、あるいは同等に扱うべきかを選ばせました。その回答は年齢、政治観、教育、LGBTQ+のアイデンティティなどで差が出たのです。

田中専務

それを機械に学習させたらどうなるのですか。うちの現場で使ったら現実の顧客に不利益が出ませんか。

AIメンター拓海

注意点はそこです。研究では、あるデモグラフィックのアノテーションで学習したモデルと別のグループで学習したモデルを同一のテストセットで比較すると、Balanced Accuracy(バランスド・アキュラシー)で統計的差が出ました。つまり導入先の利用者像に合ったデータでないとミスマッチが生じる可能性があるのです。

田中専務

なるほど。対策はありますか。全員の嗜好を混ぜれば良いですか、それとも分けて運用するのですか。

AIメンター拓海

研究はアンサンブル手法の可能性を示唆しています。複数のデモグラフィック別のモデルを作り、投票などで合議することで精度が上がる場合がありました。ただし合議の集約ルール自体が公平性の価値判断を含むため、運用前に誰の価値を優先するかを意思決定する必要があります。

田中専務

分かりました。要するに、誰のフィードバックを採るか、どう集約するかを決めないと、AIは会社の期待通りに振る舞わないということですね。自分の言葉でまとめると、導入前に対象ユーザー像と意思決定ルールを定め、必要なら複数モデルで合議する仕組みを設ける、と理解しました。

論文研究シリーズ
前の記事
中国の台頭する科学リーダーシップ
(China’s Rising Leadership in Global Science)
次の記事
F-LMM:固定された大規模マルチモーダルモデルのグラウンディング
(F-LMM: Grounding Frozen Large Multimodal Models)
関連記事
ライフコード:中心法則に基づくマルチオミクス配列統一
(Life-Code: Central Dogma Modeling with Multi-Omics Sequence Unification)
量子化による事後解釈
(Posthoc Interpretation via Quantization)
COVID-19接触追跡アプリの利用者レビューに関する感情分析とベンチマークデータセット
(Sentiment Analysis of Users’ Reviews on COVID-19 Contact Tracing Apps with a Benchmark Dataset)
大気科学を再探索する基盤モデルの可能性
(On the Opportunities of (Re)-Exploring Atmospheric Science by Foundation Models: A Case Study)
オリオン星雲集団のメンバーシップ解析
(Membership of the Orion Nebula population from the Chandra Orion Ultradeep Project)
ハッブル・ディープ・フィールド南部の電波観測 IV:微弱電波源の光学的性質
(Radio Observations of the Hubble Deep Field South Region IV: Optical Properties of the Faint Radio Population)
この記事をシェア

有益な情報を同僚や仲間と共有しませんか?

AI技術革新 - 人気記事
ブラックホールと量子機械学習の対応
(Black hole/quantum machine learning correspondence)
生成AI検索における敏感なユーザークエリの分類と分析
(Taxonomy and Analysis of Sensitive User Queries in Generative AI Search System)
DiReDi:AIoTアプリケーションのための蒸留と逆蒸留
(DiReDi: Distillation and Reverse Distillation for AIoT Applications)

PCも苦手だった私が

“AIに詳しい人“
として一目置かれる存在に!
  • AIBRプレミアム
  • 実践型生成AI活用キャンプ
あなたにオススメのカテゴリ
論文研究
さらに深い洞察を得る

AI戦略の専門知識を身につけ、競争優位性を構築しませんか?

AIBR プレミアム
年間たったの9,800円で
“AIに詳しい人”として一目置かれる存在に!

プレミア会員になって、山ほどあるAI論文の中から効率よく大事な情報を手に入れ、まわりと圧倒的な差をつけませんか?

詳細を見る
【実践型】
生成AI活用キャンプ
【文部科学省認可】
満足度100%の生成AI講座
3ヶ月後には、あなたも生成AIマスター!

「学ぶ」だけではなく「使える」ように。
経営者からも圧倒的な人気を誇るBBT大学の講座では、3ヶ月間質問し放題!誰1人置いていかずに寄り添います。

詳細を見る

AI Benchmark Researchをもっと見る

今すぐ購読し、続きを読んで、すべてのアーカイブにアクセスしましょう。

続きを読む