Training Data

157
  • 論文研究

LLM ATTRIBUTOR:LLM生成のための対話型ビジュアル帰属(LLM ATTRIBUTOR: Interactive Visual Attribution for LLM Generation)

田中専務拓海さん、最近の論文で「訓練データの帰属」を可視化するツールが出たと聞きました。うちの現場で使えるか知りたいのですが、まず要点を教えていただけますか。AIメンター拓海素晴らしい着眼点ですね!簡潔に言うと、この研究は「モデルが生成した一文がどの訓練データに由来するか」を対話的に見ら

  • 論文研究

事前学習データ検出の改良ベースライン(MIN-K%++: IMPROVED BASELINE FOR DETECTING PRE-TRAINING DATA FROM LARGE LANGUAGE MODELS)

田中専務拓海先生、最近社内で「学習データの出所を突き止める技術」が話題なんですが、正直ピンと来ません。要するに私たちの製品データや社内文書が機械学習モデルに使われているかどうかが分かる、という理解で合っていますか?AIメンター拓海素晴らしい着眼点ですね!まさにその通りです。今回の研究は、

  • 論文研究

事前学習データからの引用を通じて検証可能性を高める設計—Verifiable by Design: Aligning Language Models to Quote from Pre-Training Data

田中専務拓海先生、最近またAIの論文が話題になっているようですが、我々の現場ですぐ使えるものなんでしょうか。部下からは「検証できることが大事だ」と言われまして、正直どう判断すればいいか迷っています。AIメンター拓海素晴らしい着眼点ですね!今回はモデルの出力を検証しやすくする研究を分かりや

  • 論文研究

GPTモデルの訓練データ影響に関する研究(On Training Data Influence of GPT Models)

田中専務拓海先生、お疲れ様です。部下から「訓練データを見直せばGPTの挙動が変わる」と聞いて焦ってます。要するに、データをちょっと変えるだけで成果が良くも悪くもなるということですか?AIメンター拓海素晴らしい着眼点ですね! その通りです。今回紹介する研究は、個々の訓練例がGPTの学習過程

  • 論文研究

単一画像からの3D視点データ拡張による効果的なワインラベル認識(SINGLE-IMAGE DRIVEN 3D VIEWPOINT TRAINING DATA AUGMENTATION FOR EFFECTIVE WINE LABEL RECOGNITION)

田中専務拓海先生、最近、現場で「ラベル認識」がうまくいかないと聞きましてね。写真の角度やラベルの曲がりで誤認識が出るらしいんですが、本当にAIで何とかなるものでしょうか。うちの現場ではデータがほとんどないのが悩みです。AIメンター拓海素晴らしい着眼点ですね!ワインラベルのように文字とロゴ

  • 論文研究

プライバシー保護型畳み込みニューラルネットワークによる侵入検知(Privacy-Preserving Intrusion Detection using Convolutional Neural Networks)

田中専務拓海先生、最近部下から「プライバシーを守りながらAIで監視すべきだ」と言われましてね。論文の話が回ってきたのですが、そもそもどこが会社の役に立つのか掴めません。教えていただけますか。AIメンター拓海素晴らしい着眼点ですね!大丈夫、一緒に整理すれば要点は3つだけです。1つ目はデータ

  • 論文研究

多言語言語モデルの性能を左右する要因 (What Drives Performance in Multilingual Language Models?)

田中専務拓海先生、最近部下から「多言語モデルが重要だ」と言われるのですが、正直ピンと来ません。そもそもこの論文は何を示しているんでしょうか。AIメンター拓海素晴らしい着眼点ですね!簡潔に言うと、この研究はどの要因が多言語大規模言語モデル(Multilingual Large Langua