Adversarial Attack

898
  • 論文研究

Manipulating Hidden-Markov-Model Inferences by Corrupting Batch Data(バッチデータの改竄による隠れマルコフモデル推論の操作)

田中専務拓海先生、最近部下から「時系列データを使うモデルが攻撃される」と聞きまして、正直ピンと来ないんです。弊社の生産データが狙われるとか、そんな話ですか?AIメンター拓海素晴らしい着眼点ですね!大丈夫、難しく聞こえますが順を追えば理解できますよ。要点は三つで、誰がデータを改竄するか、ど

  • 論文研究

最悪ケースを超える堅牢性:非支配ポリシーによる適応的防御(BEYOND WORST-CASE ATTACKS: ROBUST RL WITH ADAPTIVE DEFENSE VIA NON-DOMINATED POLICIES)

田中専務拓海先生、最近部署から「強化学習(Reinforcement Learning、RL)で攻撃に強いモデルを作れるらしい」と聞いたのですが、うちの現場でも使えるものなんでしょうか。正直、理屈より投資対効果が気になります。AIメンター拓海素晴らしい着眼点ですね!大丈夫です、田中専務。

  • 論文研究

確率的多腕バンディットに対するステルス敵対的攻撃 (Stealthy Adversarial Attacks on Stochastic Multi-Armed Bandits)

田中専務拓海先生、最近うちの若手から『Banditアルゴリズムに攻撃のリスクがある』と聞きまして、正直ピンと来ないのですが、実務としてどう考えればよいのでしょうか。AIメンター拓海素晴らしい着眼点ですね!まずは結論だけ簡単にお伝えしますと、この論文は『攻撃者が目立たずに報酬情報を少し操作

  • 論文研究

柔軟な物理カムフラージュ生成(Flexible Physical Camouflage Generation Based on a Differential Approach)

田中専務拓海先生、お時間よろしいですか。最近、部下から『物理世界で機械学習のモデルを欺くカムフラージュ技術』の話が出てきまして、正直ピンと来ていません。これって要するに何をする技術なんでしょうか。AIメンター拓海素晴らしい着眼点ですね、田中専務!簡単に言うと、カムフラージュ攻撃は『現実の

  • 論文研究

AttackGNN:ハードウェアセキュリティにおけるGNNのレッドチーミングを強化学習で(AttackGNN: Red-Teaming GNNs in Hardware Security Using Reinforcement Learning)

田中専務拓海さん、最近「GNN(Graph Neural Network) グラフニューラルネットワーク を使ったハードウェアのセキュリティ解析がやばい」という話を聞きました。要するにウチの製品も狙われる可能性があるんですか?AIメンター拓海素晴らしい着眼点ですね!大丈夫、落ち着いて話し

  • 論文研究

LLMを裁く者は堅牢か?(Is LLM-as-a-Judge Robust? Investigating Universal Adversarial Attacks on Zero-shot LLM Assessment)

田中専務拓海さん、最近部下から「AIに答案を採点させたい」と言われましてね。先日この論文の話を耳にしたのですが、要するにAIの採点は簡単に騙されるという話なんでしょうか。AIメンター拓海素晴らしい着眼点ですね!田中専務、それは正確です。この論文は、採点を行う大規模言語モデル(Large

  • 論文研究

大規模言語モデルにほぼ何でもさせ、暴露させる方法(Coercing LLMs to Do and Reveal (Almost) Anything)

田中専務拓海先生、最近話題の研究で「大規模言語モデルがほぼ何でもされてしまう」っていう話を聞きました。うちでもAI導入を検討しているので、現場リスクが心配です。要するにどこがいちばん問題なんでしょうか?AIメンター拓海素晴らしい着眼点ですね!簡潔に言うと、大規模言語モデル(Large L

  • 論文研究

推論を停止せよ!マルチモーダルLLMのChain-of-Thought推論が敵対的画像に出会うとき(Stop Reasoning! When Multimodal LLM with Chain-of-Thought Reasoning Meets Adversarial Image)

田中専務拓海先生、最近部下から「Chain-of-Thoughtってやつを使えば画像もちゃんとAIが理解できます」って言われたんですが、正直何を導入すれば良いのか見当がつきません。業務での投資対効果が知りたいです。AIメンター拓海素晴らしい着眼点ですね!まず結論から言うと、本論文は「マル

  • 論文研究

言語モデルへの高速敵対的攻撃 — Fast Adversarial Attacks on Language Models in One GPU Minute

田中専務拓海さん、最近の論文で「1 GPU分の時間で言語モデルを攻撃できる」なんて話を聞きまして、現場で何が起きるのか正直ピンときません。要点を教えていただけますか。AIメンター拓海素晴らしい着眼点ですね!端的に言うと、この論文は「BEAST」という手法で、短時間かつ計算資源を抑えてチャ

  • 論文研究

車両検出器への堅牢で高精度な迷彩攻撃(RAUCA: A Novel Physical Adversarial Attack on Vehicle Detectors via Robust and Accurate Camouflage Generation)

田中専務拓海先生、お忙しいところ恐縮です。最近、社内で「自動運転や防犯カメラが敵対的攻撃で誤認される」と聞きまして、具体的に何が起きるのか分かりません。要するにどれほど現実的な脅威なのでしょうか。AIメンター拓海素晴らしい着眼点ですね!大丈夫です、ゆっくり説明しますよ。簡単に言うと、人工