2025.08.15

論文研究

4 分で読了

0 views

どのデータ属性が数学とコード推論を刺激するか

（Which Data Attributes Stimulate Math and Code Reasoning?）

- メールで送る
- リンクをコピーする

AI戦略の専門知識を身につけ、競争優位性を構築しませんか？

AIBR プレミアム

年間たったの9,800円で

“AIに詳しい人”として
一目置かれる存在に！

プレミア会員になって、山ほどあるAI論文の中から効率よく大事な情報を手に入れ、まわりと圧倒的な差をつけませんか？

詳細を見る

【実践型】
生成AI活用キャンプ

【文部科学省認可】
満足度100%の生成AI講座

3ヶ月後には、
あなたも生成AIマスター！

「学ぶ」だけではなく「使える」ように。
経営者からも圧倒的な人気を誇るBBT大学の講座では、3ヶ月間質問し放題！誰1人置いていかずに寄り添います。

詳細を見る

田中専務

拓海先生、お忙しいところすみません。最近、部下から「ある論文でトレーニングデータの混ぜ方でモデルの推論力が変わる」と聞いたのですが、正直ピンと来ません。弊社で使うときの投資対効果を知りたいのです。

AIメンター拓海

素晴らしい着眼点ですね！簡潔に言うと、この研究は「どの種類のトレーニング例が数学的推論とコード推論を効果的に伸ばすか」を定量的に調べたものですよ。難しい専門語は使わず、まず全体の直感をお伝えしますね。

田中専務

要するにデータの“混ぜ方”で賢さが変わると。具体的にはどんな混ぜ方が良いのでしょうか。現場で試すなら、無駄なデータを削って注力したいのです。

AIメンター拓海

良い質問です。結論を3点で示すと、1) 高難度の数学問題、2) 低難度のコード問題、3) 長めの思考過程（Chain-of-Thought）を混ぜると相互に効果が出やすい、という結果です。仕組みは後で例えながら説明しますよ。

田中専務

なるほど。ですがその“効果”はどうやって測ったのですか？過去に聞いた手法は経験則が多かった気がしますが、本論文は何か新しい分析法を使ったのでしょうか。

AIメンター拓海

その通り、従来はヒューリスティック（経験則）でデータを選ぶことが多かったのです。本研究はInfluence Functions（影響関数）という手法を用いて、個々の訓練例が最終的な推論性能にどれだけ寄与したかを定量的に追跡しています。影響関数は、ある訓練例を取り除いたときに評価指標がどう変わるかを数学的に近似する道具です。

田中専務

これって要するに〇〇ということ？

AIメンター拓海

はい、その通りです。言い換えると「どの個々の学習例がモデルの数学力やコード力を本当に強化しているか」を数値で示す方法だと理解してください。だから無駄なデータを削り、効果的なデータだけに投資する判断ができるんです。

田中専務

現場の言葉で言えば、効果の薄い研修に金を使うのは無駄だと。影響関数で優先順位をつければ、投資効率が高まるという理解で良いですか。

AIメンター拓海

まさにその通りです。経営視点ならROI（投資対効果）の高いデータに集中する方が効率的です。加えて本研究は、数学とコードが互いにどう影響し合うかまで踏み込んで示しているため、データ設計の方針決定に直接役立ちますよ。

田中専務

導入で懸念があるのは現場の負担です。データを分析して優先順位をつける工数が増えるなら、結局コスト増ではないですか。

AIメンター拓海

ご安心ください。ここは段階的に進められます。まずは影響の高い少量のデータで実験し、効果が確認できた段階でスケールする流れです。短期的な工数は増えるが、中長期で見れば学習効率の改善でコスト削減につながりますよ。

田中専務

わかりました。最後に私の理解を整理しますと、まず影響関数で“貢献度の高い訓練例”を見つけ、次に高難度の数学問題と低難度のコード問題を意図的に混ぜたデータを使ってモデルを訓練すれば、効率的に推論力が伸びる、ということですね。

AIメンター拓海

その通りです！素晴らしい要約です。大丈夫、一緒に進めれば必ずできますよ。次回は実際の社内データで小さな実験計画を立てましょう。

監修者

阪上雅昭（SAKAGAMI Masa-aki）
京都大学　人間・環境学研究科　名誉教授

PCも苦手だった私が

“AIに詳しい人“
として一目置かれる存在に！

論文研究

どのデータ属性が数学とコード推論を刺激するか

さらに深い洞察を得る

AIBR プレミアム

“AIに詳しい人”として
一目置かれる存在に！

【実践型】
生成AI活用キャンプ

3ヶ月後には、
あなたも生成AIマスター！

監修者

論文研究シリーズ

AI技術革新 - 人気記事

“AIに詳しい人“
として一目置かれる存在に！

あなたにオススメのカテゴリ

さらに深い洞察を得る

AIBR プレミアム

“AIに詳しい人”として一目置かれる存在に！

【実践型】
生成AI活用キャンプ

3ヶ月後には、あなたも生成AIマスター！

どのデータ属性が数学とコード推論を刺激するか

さらに深い洞察を得る

AIBR プレミアム

“AIに詳しい人”として一目置かれる存在に！

【実践型】 生成AI活用キャンプ

3ヶ月後には、あなたも生成AIマスター！

監修者

論文研究シリーズ

関連記事

この記事をシェア

AI技術革新 - 人気記事

“AIに詳しい人“として一目置かれる存在に！

あなたにオススメのカテゴリ

さらに深い洞察を得る

AIBR プレミアム

“AIに詳しい人”として一目置かれる存在に！

【実践型】 生成AI活用キャンプ

3ヶ月後には、あなたも生成AIマスター！

AI Benchmark Researchをもっと見る

“AIに詳しい人”として
一目置かれる存在に！

【実践型】
生成AI活用キャンプ

3ヶ月後には、
あなたも生成AIマスター！

“AIに詳しい人“
として一目置かれる存在に！

【実践型】
生成AI活用キャンプ