Training Data

360
  • 論文研究

訓練データの剪定が性能を支えた(It was the training data pruning too!)

田中専務拓海さん、最近の論文で「訓練データの剪定が重要だった」という話を見かけたんですが、あれは要するに何が変わるんですか。AIメンター拓海素晴らしい着眼点ですね!簡潔に言うと、モデルの構造だけでなく、学習に使うデータを事前に"剪定"しておくことが、精度を大きく左右する、という発見です。

  • 論文研究

限られた音声データで鳥種を識別する多チャネルCNN手法(Audio-only Bird Species Automated Identification Method with Limited Training Data Based on Multi-Channel Deep Convolutional Neural Networks)

田中専務拓海先生、最近部署から「フィールド音声で鳥種を自動分類できる技術がある」と聞きましたが、うちのようにデータが少ない現場でも使えるものなのでしょうか。AIメンター拓海素晴らしい着眼点ですね!大丈夫、今回の論文はまさに「データが少ない場面でどうやって音だけで鳥を判別するか」を扱ってい

  • 論文研究

ニューラルネットワークにおける意図しない記憶の評価と検証(The Secret Sharer: Evaluating and Testing Unintended Memorization in Neural Networks)

田中専務拓海先生、最近うちの若手が「モデルが勝手に秘密を覚える」って怖い話を持ってきましてね。うちのメールや設計図みたいな機密情報がAIから漏れるなんてある話ですか。AIメンター拓海素晴らしい着眼点ですね!大丈夫、田中専務。今日はその不安を解消する論文の要点を丁寧に整理しますよ。結論を先

  • 論文研究

OCRを騙す敵対的テキスト画像の衝撃(Fooling OCR Systems with Adversarial Text Images)

田中専務拓海先生、最近うちの現場でもスキャンしてデジタル化した文書を機械で分類する話が出てましてね。そんなときに「OCRが簡単に騙される」と聞いて驚きまして、本当に大丈夫なのか不安なんです。AIメンター拓海素晴らしい着眼点ですね!OCRはOptical Character Recogni

  • 論文研究

ハイパーパラメータ窃取攻撃の実態(Stealing Hyperparameters in Machine Learning)

田中専務拓海さん、最近部下から「学習モデルのハイパーパラメータが漏れると危ない」と言われて困っています。要するにどれほど深刻なんでしょうか。AIメンター拓海素晴らしい着眼点ですね!結論を先に言うと、ハイパーパラメータが漏れるとモデルの商業的価値や再現性が簡単に奪われるリスクがある

  • 論文研究

良い合成訓練データとは何か(What Makes Good Synthetic Training Data for Learning Disparity and Optical Flow Estimation?)

田中専務拓海先生、最近部下から『合成データで学習させるのが大事だ』と聞いておりまして、正直よく分かりません。合成データって要するに何が良いのですか。AIメンター拓海素晴らしい着眼点ですね!合成データとは現実の写真を使わずに、コンピュータグラフィックスなどで人工的に作った学習用データのこと

  • 論文研究

自己教師ありFCNによる非剛体画像レジストレーション(NON-RIGID IMAGE REGISTRATION USING SELF-SUPERVISED FULLY CONVOLUTIONAL NETWORKS WITHOUT TRAINING DATA)

田中専務拓海さん、最近うちの若手が「自己教師あり学習」って論文を読めばいいって言うんですが、正直私は論文を読むのが苦手でして、これが実務でどう役立つのか端的に教えてほしいんです。AIメンター拓海素晴らしい着眼点ですね!大丈夫、一緒にやれば必ずできますよ。まず結論を3つだけお伝えします。1

  • 論文研究

画像分類に効く単純なデータ拡張法:SamplePairing(Data Augmentation by Pairing Samples for Images Classification)

田中専務拓海先生、最近部署から『AIで画像分類をやれば効率が上がる』と言われて迷っているんです。そもそも学習データが少ないと聞くのですが、何か手はありますか。AIメンター拓海素晴らしい着眼点ですね!大丈夫、一緒に整理していけばできますよ。要点は三つだけ押さえれば良いんです。まず、データが

  • 論文研究

限定ラベルデータでの皮膚病変分類に向けた雑音除去敵対的オートエンコーダ(Denoising Adversarial Autoencoders: Classifying Skin Lesions Using Limited Labelled Training Data)

田中専務拓海先生、聞いてください。部下から「AIで画像診断をやれ」と言われて困っています。うちには大量の画像データはあるが、ラベル付けはほとんどないと聞きました。これって本当に使える技術なのでしょうか。AIメンター拓海素晴らしい着眼点ですね!大丈夫、同じ悩みを持つ企業は多いですよ。今回の

  • 論文研究

ダウンサンプリング攻撃と深層学習の脆弱性(Wolf in Sheep’s Clothing – The Downscaling Attack Against Deep Learning Applications)

田中専務拓海先生、最近部署から「画像認識にAIを入れるべきだ」と言われまして。ただ、現場からは「見た目では問題ないのに誤判定が起きる」と報告が上がっており、何が原因かよく分かりません。こういうのって本当に現実的なリスクなんでしょうか?AIメンター拓海素晴らしい着眼点ですね!大丈夫、重要な