
拓海先生、お時間いただきありがとうございます。部下から『接触データで感染シミュレーションをやるべきだ』と強く言われているのですが、うちのデータは抜けや欠損が多くて心配です。こういうときに頼れる方法ってあるのでしょうか。

素晴らしい着眼点ですね!大丈夫、一緒に整理すれば必ずできますよ。要点を先に三つで言うと、(1) 欠損があっても全体の拡がりを推定できる手法がある、(2) 個々のリンクを完全に復元する必要はない、(3) メソッドは現場のデータで実用的に働く、ということです。まず何が不安ですか?

要するに、データの一部が抜けていても「社内での広がり」をちゃんと見積れるなら、投資の判断につなげられるかもしれません。ですが、個別の人の接触がわからないと意味がないのではと心配です。これって要するに個々の関係を全部直す必要はないということですか?

そのとおりです。例えるなら、工場の生産ラインで一部の工程記録が抜けていても、ライン全体の歩留まりを予測できれば経営判断はできる、という話ですよ。論文の手法は個別リンクの完全復元ではなく、全体の拡がりを再現するための代替(サロゲート)ネットワークを作る点が肝です。

そのサロゲートネットワークという言葉はわかりやすいです。現場で言えば、全部の検査結果を埋めるよりも、全体の感染率の予測が合っているかが大事ということですね。ただ、実務で使う時の精度や不確かさはどう管理すれば良いでしょうか。

良い問いですね。論文では不確かさを扱うために複数の再現(リサンプリング)を行い、感染サイズの分布で比較します。経営判断で使うなら、平均だけでなく分布の幅を見ること、複数シナリオで感度分析を行うこと、そして現場データが増えたら逐次更新する三点を実務ルールにすると安全に運用できますよ。

つまり、点の予測だけで決めるのではなく、幅を見てリスク許容度を経営判断に含めるということですね。現場の担当に落とすときの説明はどう簡潔にすれば良いですか。

現場向けは短く三つ。まず、データに抜けがあっても『全体の広がり』は推定できる点。次に、複数の再現で結果のばらつきを見て判断する点。最後に、新しいデータが入ったら結果を更新する点。これを標準手順にすれば、担当も運用しやすくなりますよ。

分かりました、要点は自分の言葉でまとめると「個々の接触を全部直す必要はなく、補完したサロゲートで全体の拡がりを見て、ばらつきを考慮して判断する」ということですね。ありがとうございました、拓海先生。


