
拓海先生、最近部下から「在庫の売れ行きデータにゼロが多いのでAIで何とか」と言われまして。そもそもゼロが多いって、うちではただ売れてないだけではないんですか?

素晴らしい着眼点ですね!田中専務、その「ゼロ」には種類があるんです。大丈夫、一緒に分解して考えれば見えてきますよ。

種類?例えば在庫切れや記録ミスとか、そういうのを分けるという話ですか。それって現場に負担かかるんじゃないですか。

いい質問です。ポイントは三つです。まずデータ上のゼロが「自然発生」か「異常」かを自動で識別すること。次に需要の性質を分類して、それぞれに合うモデルを使うこと。最後に、無理に現場で手作業を増やさず統計で補うことです。導入の負担は最小化できますよ。

なるほど。で、「需要の性質を分類」するって、要するに売れ方のパターンを分けるということですか?

まさにその通りですよ!需要は大きく分けて、継続的に売れるもの(regular)、日によって売れない日が混ざるもの(intermittent)で、その中でも連続的に少しずつ売れるタイプと、たまに大量に売れるタイプに分かれます。それぞれ解析のやり方が違うんです。

それなら当社でも、毎日少し売れる商品と、見た目は売れてないけど繁忙期にドカンと出る商品がある。で、ここで言う「異常なゼロ」ってのは在庫切れのことですよね?

その通りです。異常なゼロは在庫切れや入力ミスの可能性があるので、まずそれを統計モデルで見つけるんです。見つけたらその部分を別処理にして、残りの需要を本来のモデルで扱う。これが二段階の考え方です。

それをやれば在庫切れで需要がゼロに見えている分を誤って学習しないようにするわけですね。ところで、実際の精度ってどれくらい改善するものですか。投資対効果が気になります。

良い視点です。論文では、この二段階(異常ゼロ検出→需要タイプ分類)の処理を入れるだけで、特徴量を工夫した場合に予測精度が有意に改善すると示しています。要点は三つ。無駄なゼロを混ぜないこと、需要確率とサイズを分けて扱うこと、そして情報基準でモデルを選ぶことです。

これって要するに、売れる確率と売れる量を別々に見る“二刀流”を使えということですか?それなら我々の発注ロジックにも説明が付けやすいですね。

正解です!その“二刀流”はビジネス上も説明しやすい。実務では、売れるかどうかを確率モデルで、売れる量を別の分布で扱うと、発注量や安全在庫の設計が合理的になりますよ。大丈夫、一緒に導入計画も組めます。

分かりました。まずは在庫切れの検出と、そのあとに需要のタイプごとに別のモデルを当てる。自分の言葉で言えば、データの“ゼロの正体”を見極めてから、それぞれに合う道具で予測する、ということですね。


