One Language, Many Gaps: Evaluating Dialect Fairness and Robustness of Large Language Models in Reasoning Tasks(言語は一つでも格差は多い:推論タスクにおける大規模言語モデルの方言公平性と頑健性の評価)
田中専務拓海先生、お忙しいところありがとうございます。最近、部下から『LLM(大規模言語モデル)は方言に弱い』なんて話を聞きまして、うちみたいな現場にも関係あるんでしょうか。AIメンター拓海素晴らしい着眼点ですね!大丈夫、簡単に整理しますよ。要点は三つです。モデルは訓練データの代表性に依