Training Data

157
  • 論文研究

ℓ-多様性を用いたデータ分類の統計的学習理論的アプローチ(Statistical Learning Theory Approach for Data Classification with ℓ-diversity)

田中専務拓海先生、最近うちの部下から「匿名化データでも学習できます」なんて話を聞いて戸惑っています。機密情報を守るために匿名化したら、結局性能が落ちるのではないでしょうか。AIメンター拓海素晴らしい着眼点ですね!結論を先に言うと、この論文は「匿名化の特定手法であるanatomyとℓ-di

  • 論文研究

秘匿学習データからの半教師あり知識移転(Semi-Supervised Knowledge Transfer for Deep Learning from Private Training Data)

田中専務拓海先生、最近うちの若手が『PATE』って言葉を持ち出してきてまして、何やら社内データの秘密を守れるって話なんですが、本当に実務で使えるんでしょうか。AIメンター拓海素晴らしい着眼点ですね!PATE(Private Aggregation of Teacher Ensembles

  • 論文研究

医療テキスト中の薬剤名抽出のための訓練データ特性に基づく新しいデータ表現(A New Data Representation Based on Training Data Characteristics to Extract Drug Named-Entity in Medical Text)

田中専務拓海先生、最近部署で"薬の名称を自動で抜く技術"が話題になっておりまして、部下からこの論文が良いと勧められましたが、正直何から理解すれば良いか分からず困っています。要するに現場で役に立つんでしょうか?AIメンター拓海素晴らしい着眼点ですね!大丈夫、一緒に整理すれば必ず分かるんです

  • 論文研究

サンプル雨画像を用いた雨構造転送による合成雨画像生成(Rain Structure Transfer Using an Exemplar Rain Image for Synthetic Rain Image Generation)

田中専務拓海さん、最近うちの現場で『画像の天候を人工的に作る』って話が出てまして、論文を渡されたんですが正直最初からつまずいています。これって経営判断に直結する話でしょうか?AIメンター拓海素晴らしい着眼点ですね!大丈夫、簡単にお話しますよ。結論を先に言うと、この研究は既存の写真から“雨

  • 論文研究

SVM分類器を汚染攻撃から守る手法(Curie: A method for protecting SVM Classifier from Poisoning Attack)

田中専務拓海先生、最近部下が「学習データの汚染攻撃を防ぐべきだ」と騒いでいて困っています。そもそも汚染攻撃って何ですか。AIメンター拓海素晴らしい着眼点ですね!汚染攻撃とは、学習データにわざと悪いデータを混ぜて、モデルの判定を誤らせる攻撃です。簡単に言えば名簿に偽の名刺を混ぜて受付を騙す

  • 論文研究

機械学習タスクのデバッグ (Debugging Machine Learning Tasks)

田中専務拓海先生、お忙しいところ失礼します。部下から「学習データに誤りがあるとAIはとんでもない判断をする」と聞きましたが、実務として何が問題になるのでしょうか。AIメンター拓海素晴らしい着眼点ですね!結論から言うと、モデルが誤った判断をする多くの原因はコードではなくトレーニングデータに

  • 論文研究

固有表現認識のためのニューラルアーキテクチャ(Neural Architectures for Named Entity Recognition)

田中専務拓海先生、最近、部下から「固有表現認識をAIでやれば業務効率が上がる」と聞きまして、正直よく分からないのですが、本当に現場で効く技術なのでしょうか。AIメンター拓海素晴らしい着眼点ですね!固有表現認識(Named Entity Recognition、NER)は、文書から会社名や

  • 論文研究

新しいオブジェクトカテゴリを記述する深層構成的キャプショニング(Deep Compositional Captioning: Describing Novel Object Categories without Paired Training Data)

田中専務拓海さん、最近若手から『画像の説明を新しい物体について自動生成できる論文』があるって聞いたんですが、うちの現場にも関係ありますか?正直、何が新しいのかが掴めていません。AIメンター拓海素晴らしい着眼点ですね!大丈夫、一緒に整理しましょう。要点は三つです。1) ペアになった画像と言

  • 論文研究

ベイズ的共分散モデリングと未知モデルパラメータの非パラメトリック逆学習(Bayesian Covariance Modelling of Large Tensor-Variate Data Sets & Inverse Non-parametric Learning of the Unknown Model Parameter Vector)

田中専務拓海先生、お忙しいところ恐れ入ります。最近、部下から『テンソルデータの共分散をベイズでモデリングして未知のパラメータを逆推定する論文』を読むよう言われまして、正直何がビジネスに役立つのか掴めません。要するに、これって我が社のデータ活用でどう役に立つんでしょうか?AIメンター拓海素

  • 論文研究

未知の音環境での鳥の鳴き声検出(Detecting bird sound in unknown acoustic background using crowdsourced training data)

田中専務拓海さん、最近部署で「音で生物を監視できる」と聞きましたが、現場がごちゃごちゃした場所だと本当に使い物になるんでしょうか。現実の工場や港みたいな雑音だらけの場所を想像しています。AIメンター拓海素晴らしい着眼点ですね!要は雑音(バックグラウンド音)が混じると識別が難しくなるのです