Training Data

335
  • 論文研究

構成可能な拡散モデルによる学習データ保護 (Training Data Protection with Compositional Diffusion Models)

田中専務拓海先生、最近部下から『AIに学習させるデータを分けて安全に運用できる』という話を聞きまして。うちの現場のデータは扱いが難しくて、外に出すのも怖いんです。これは本当でしょうか。AIメンター拓海素晴らしい着眼点ですね!大丈夫、一緒に整理しましょう。今回の肝はCompositiona

  • 論文研究

正確で説明可能かつプライベートなモデル:説明(リコース)を提供しつつ学習データの漏洩を最小化する方法(Accurate, Explainable, and Private Models: Providing Recourse While Minimizing Training Data Leakage)

田中専務拓海先生、最近部下から「説明可能なAIにはプライバシーリスクがある」と言われまして、正直どう関わればいいのか分かりません。まずこの論文は何を変えるんでしょうか。AIメンター拓海素晴らしい着眼点ですね!この研究は、AIが「どう改善すれば合格するか」を教える説明(リコース)が、逆に学

  • 論文研究

OpenProteinSet:大規模構造生物学向けトレーニングデータ(OpenProteinSet: Training data for structural biology at scale)

田中専務拓海先生、最近若手から「OpenProteinSetっていうデータが凄い」と聞きまして。AIでタンパク質の構造を当てる話だとは思うのですが、うちのような製造業に何か関係ありますか?AIメンター拓海素晴らしい着眼点ですね!大丈夫、一緒に分かりやすく整理しますよ。要点を先にお伝えする

  • 論文研究

差分プライバシー、言語的公平性、訓練データ影響—多言語言語モデルの不可能性と可能性の定理(Differential Privacy, Linguistic Fairness, and Training Data Influence: Impossibility and Possibility Theorems for Multilingual Language Models)

田中専務拓海先生、お忙しいところ恐縮です。部下から『この論文を読んで導入方針を考えろ』と言われまして、正直何を基準に議論すればいいのか分かりません。要点を教えていただけますか。AIメンター拓海素晴らしい着眼点ですね!大丈夫、一緒に整理していきましょう。要はこの論文は『多言語に対応した大き

  • 論文研究

遅延確率的勾配降下法の一般化可能性の理解に向けて(Towards Understanding the Generalizability of Delayed Stochastic Gradient Descent)

田中専務拓海先生、最近うちの若手が「非同期で学習させると遅延が出ますが精度に影響ありますか」と言い出して困ってます。そもそも遅延って何を指すんでしょうか。AIメンター拓海素晴らしい着眼点ですね!遅延とは、モデルの更新で使う勾配情報が古いタイミングのものになることですよ。工場で言えば、現場

  • 論文研究

機械学習の訓練データの分布特性を証明する方法(Attesting Distributional Properties of Training Data for Machine Learning)

田中専務拓海さん、最近うちの若手から「訓練データの分布を証明できる仕組みが必要だ」って言われまして。正直、何を証明する必要があるのか最初から教えてくださいませんか。AIメンター拓海素晴らしい着眼点ですね!まず結論を簡単に。今回の論文は、「訓練データがある属性について適切な分布を持っている

  • 論文研究

限られた学習データ下における重要特徴抽出と判別(Crucial Feature Capture and Discrimination for Limited Training Data SAR ATR)

田中専務拓海先生、最近部署で「SARの画像認識でデータが少ないとダメだ」と言われまして、困っているんです。そもそもSARって何が違うんでしょうか。AIメンター拓海素晴らしい着眼点ですね!Synthetic Aperture Radar(SAR:合成開口レーダー)は光学カメラと違い昼夜・天

  • 論文研究

最小多段階機械学習(M3L)による学習データ削減の実証 — Reducing Training Data Needs with Minimal Multilevel Machine Learning (M3L)

田中専務拓海先生、最近若手から「M3Lって論文がきてます」と言われたのですが、正直何がそんなにすごいのか分かりません。要するにコストが下がるという話ですか?AIメンター拓海素晴らしい着眼点ですね!大丈夫、わかりやすく噛み砕きますよ。簡単に言うと、この研究は「高精度な結果を出すために必要な

  • 論文研究

汚染データを伴う完全教師なし異常検知のための汎用機械学習フレームワーク(A Generic Machine Learning Framework for Fully-Unsupervised Anomaly Detection with Contaminated Data)

田中専務拓海先生、最近部署で「異常検知(Anomaly Detection)が重要だ」と言われてましてね。が、現場のデータはどうせ汚れているし、学習に使うデータが完璧な正常だけとは限らないと聞いて不安なのです。こういう状況でもちゃんと使える方法があるんでしょうか。AIメンター拓海素晴らし

  • 論文研究

Is Your Learned Query Optimizer Behaving As You Expect? — 学習型クエリ最適化器は期待通りに動いているか?

田中専務拓海先生、最近うちの若手が「学習型クエリ最適化器(Learned Query Optimizer)を導入すべきだ」と騒いでいます。要するにSQLの実行計画をAIに任せるという話だと聞いているのですが、経営判断として投資に値しますか?AIメンター拓海素晴らしい着眼点ですね!まず結論