
田中専務
拓海先生、最近部下から「データの偏りでAIがちゃんと動かない」と言われて困っているのですが、論文で何か良い手法はありますか。

AIメンター拓海
素晴らしい着眼点ですね!多くの実務データは「一部のラベルだけが頻出で他は希少」という偏りがあり、それが原因でAIが頻出クラスばかり正確に判断してしまう問題がありますよ。

田中専務
要するに、よく見るラベルとほとんど見ないラベルで学習が偏って、現場で使える精度が出ないと。これってうちの在庫データとか検査データにも当てはまるのですか。

AIメンター拓海
大丈夫、現場データの典型的な悩みですよ。今回の論文はPartial Label Masking、略してPLMという手法で、学習時にラベルを確率的に見えなくしてバランスを取るという発想です。

田中専務
ラベルを隠す?それはデータを減らすことにならないのですか。投資対効果を考えると無駄なことは避けたいのですが。

AIメンター拓海


