Training Data

335
  • 論文研究

LMM-Detによる大規模マルチモーダルモデルの物体検出最適化(LMM-Det: Make Large Multimodal Models Excel in Object Detection)

1. 概要と位置づけ結論から述べる。本研究はLarge Multimodal Models(LMM、大規模マルチモーダルモデル)を、専用の検出モジュールを組み込まずに物体検出(object detection)タスクで有効に動作させる手法を示した点で意義がある。従来、画像領域の精密な検出はSalie

  • 論文研究

限定された学習データ下におけるアニーリング付き因子分解機の最適化性能(Optimization Performance of Factorization Machine with Annealing under Limited Training Data)

田中専務拓海先生、お時間ありがとうございます。最近、社内で「学習データが少ないときに有効な手法」が話題になっておりまして、何が現実的なのか教えていただけますか。AIメンター拓海素晴らしい着眼点ですね!学習データが限られる状況でも比較的扱いやすいのが因子分解機(Factorization Machi

  • 論文研究

Wind Turbine Feature Detection Using Deep Learning and Synthetic Data(風力タービン特徴検出における深層学習と合成データ)

田中専務拓海先生、最近部下からドローン点検とAIの話を聞いて困っております。論文を読めと言われたのですが、何を見れば投資対効果があるか全くわからないのです。AIメンター拓海素晴らしい着眼点ですね!大丈夫、一緒に要点を押さえましょう。今回の論文は「合成画像だけで学習したモデルが実地データで

  • 論文研究

大型言語モデルに対するポイズニング攻撃の体系的レビュー(A Systematic Review of Poisoning Attacks Against Large Language Models)

田中専務拓海先生、最近社内で「LLMのポイズニング」という話が出ましてね。ぶっちゃけ何が怖いのか、経営判断の観点で教えていただけますか。AIメンター拓海素晴らしい着眼点ですね!結論を先に言うと、ポイズニング攻撃はモデルの学習データに「毒」を混ぜて、後から望ましくない振る舞いを引き出す攻撃

  • 論文研究

損失関数正則化による差分プライバシー保護(Differential Privacy Regularization: Protecting Training Data Through Loss Function Regularization)

田中専務拓海先生、最近部下から「差分プライバシーを導入しろ」と言われて困っております。うちのような古い工場でも本当に必要なのでしょうか。投資対効果が不透明で不安なのです。AIメンター拓海素晴らしい着眼点ですね!差分プライバシー(Differential Privacy、DP)は、個々のデ

  • 論文研究

立場:メンバーシップ推論攻撃はモデルがあなたのデータで学習されたことを証明できない(Position: Membership Inference Attacks Cannot Prove that a Model Was Trained On Your Data)

田中専務拓海先生、最近ウチの部下が「訴訟対策でデータが使われているか証明できるか」って騒いでまして、本当にモデルが自分のデータで学習したかどうかを示せる方法はありますか。AIメンター拓海素晴らしい着眼点ですね!大丈夫、一緒に整理しましょう。要点は三つです。まず、よく提案される『メンバーシ

  • 論文研究

無条件拡散モデルからの訓練データ抽出(Extracting Training Data from Unconditional Diffusion Models)

田中専務拓海先生、最近うちの部下が「生成AIのモデルが学習データを吐き出すリスクがある」と言ってきましてね。正直、何を恐れればいいのか見当がつかないのです。無条件の拡散モデルというものが関係する、と聞きましたが、それはどういう話なのでしょうか。AIメンター拓海素晴らしい着眼点ですね!まず

  • 論文研究

GPT-4oを金本位に:言語モデル事前学習データのフィルタリングに向けたスケーラブルで汎用的アプローチ(GPT-4o as the Gold Standard: A Scalable and General Purpose Approach to Filter Language Model Pretraining Data)

田中専務拓海先生、最近GPT-4oという名前を役員会で聞きまして、ある論文がデータフィルタの基準にすると書いてあると部下が言うのですが、正直よくわからないのです。AIメンター拓海素晴らしい着眼点ですね!まず要点を端的に言うと、GPT-4oは『高品質なデータの判定基準(ゴールドスタンダード)』として優

  • 論文研究

大規模言語モデルの訓練データ検出:期待値最大化法(Detecting Training Data of Large Language Models via Expectation Maximization)

田中専務拓海さん、最近の論文で「大規模言語モデルの訓練データを検出する」という話題を目にしたのですが、正直ピンときません。うちの会社で何か関係がありますか?AIメンター拓海素晴らしい着眼点ですね!大丈夫、簡単に説明しますよ。要点を3つで言うと、1)モデルがどのデータで学んだかを推定する技

  • 論文研究

3Dガウス・スプラッティングに対する計算コスト攻撃(POISON-SPLAT: COMPUTATION COST ATTACK ON 3D GAUSSIAN SPLATTING)

田中専務拓海さん、お世話になります。最近、3Dの表現で効率が良い「3Dガウス・スプラッティング」という技術の話を聞きましたが、うちの現場で導入する際にセキュリティやコスト面でどんな注意が必要でしょうか。AIメンター拓海素晴らしい着眼点ですね!大丈夫、一緒に分かりやすく整理しますよ。まず結