
田中専務
拓海先生、お忙しいところ失礼します。最近、部下から「学習済みの言語モデルにバックドアが入っているかもしれない」と聞かされまして、正直ピンと来ていません。これって要するに、悪意ある仕掛けでモデルが特定のキーワードに反応して誤動作するということで合っていますか?

AIメンター拓海
(Task-Agnostic Detector for Insertion-Based Backdoor Attacks)

拓海先生、お忙しいところ失礼します。最近、部下から「学習済みの言語モデルにバックドアが入っているかもしれない」と聞かされまして、正直ピンと来ていません。これって要するに、悪意ある仕掛けでモデルが特定のキーワードに反応して誤動作するということで合っていますか?
