4 分で読了
1 views

バグの「自然さ」を再考する:再帰型ニューラルネットワークによる解析

(Exploring the Naturalness of Buggy Code with Recurrent Neural Networks)

さらに深い洞察を得る

AI戦略の専門知識を身につけ、競争優位性を構築しませんか?

AIBR プレミアム
年間たったの9,800円で
“AIに詳しい人”として
一目置かれる存在に!

プレミア会員になって、山ほどあるAI論文の中から効率よく大事な情報を手に入れ、まわりと圧倒的な差をつけませんか?

詳細を見る
【実践型】
生成AI活用キャンプ
【文部科学省認可】
満足度100%の生成AI講座
3ヶ月後には、
あなたも生成AIマスター!

「学ぶ」だけではなく「使える」ように。
経営者からも圧倒的な人気を誇るBBT大学の講座では、3ヶ月間質問し放題!誰1人置いていかずに寄り添います。

詳細を見る

田中専務

拓海先生、お忙しいところすみません。部下から『コードのバグは「不自然な書き方」で見つかる』と聞いて驚きました。これって要するに、機械が文章の違和感を見つけるのと同じようにコードの違和感を見つけられるということですか?

AIメンター拓海

素晴らしい着眼点ですね!その通りです。研究では、人が読む自然言語の「違和感」に相当する指標を、ソースコードに対して機械で計算してバグを検出できるかを調べているんですよ。

田中専務

なるほど。ただ、我々の現場は古いコードが多く、パターンもばらばらです。投資対効果の観点で、本当に導入する価値がありますか?

AIメンター拓海

大丈夫、一緒に評価すれば必ずできますよ。要点は三つです。第一に、モデルは過去のコードから『よくある書き方』を学ぶこと、第二に、その観点から外れた行を高いエントロピー(不確実性)として検出すること、第三に、それを優先順位付けに使えば検査工数を減らせることです。

田中専務

ほう、過去のコードから学ぶということは、我々の古いリポジトリでも学習は可能ということですね。ただ、具体的にはどんな技術が良いのですか?

AIメンター拓海

ここが肝心ですね。昔は『n-gram(エヌグラム)言語モデル』が多かったのですが、今回の研究は『LSTM(Long Short-Term Memory)長短期記憶』と呼ぶ再帰型ニューラルネットワークを使っています。簡単に言えば、遠く離れた関係も覚えられる仕組みです。

田中専務

これって要するに、関係性の遠い部分まで覚えられるから、大きな関数やファイルでもおかしな所を見つけやすくなるということですか?

AIメンター拓海

その通りですよ。良い理解です。加えて、研究では『エントロピー(entropy)』という数値でその『違和感』を定量化しており、高いエントロピーは『モデルから見て予測しにくい行』、すなわちバグの候補になりうるとしています。

田中専務

実務では誤検知も怖いです。検出したものを全部調べる余力はありません。誤検知を減らす工夫や評価はどうしているのですか?

AIメンター拓海

良い質問です。研究では評価にAUC(Area Under the Curve、曲線下面積)を使っており、LSTMは従来のn-gramモデルに比べてわずかに高いAUCを示しました。運用では閾値を調整して上位から優先的にレビューする運用設計が現実的です。

田中専務

つまり、すべてを自動で直すのではなく、検査の優先順位を付けるのが現実的だと。わかりました、最後に要点を私の言葉で整理してもよろしいですか?

AIメンター拓海

ぜひお願いします。どんな表現でも構いませんから、自分の言葉でまとめてくださいね。

田中専務

承知しました。要するに、過去のコードから『普通の書き方』を学ばせて、そこから外れる場所を機械が高い『違和感スコア』として示す。重要な箇所だけを上から点検する運用にすれば、工数を抑えつつバグ発見の効率が上がる、ということですね。

監修者

阪上雅昭(SAKAGAMI Masa-aki)
京都大学 人間・環境学研究科 名誉教授

論文研究シリーズ
前の記事
単一画像の被写界深度にも効く濃霧除去の新潮流
(A Cascaded Convolutional Neural Network for Single Image Dehazing)
次の記事
嚢胞性線維症における肺異常の定量化
(Quantification of Lung Abnormalities in Cystic Fibrosis using Deep Networks)
関連記事
合成表形式データ生成に関する包括的サーベイ
(A Comprehensive Survey of Synthetic Tabular Data Generation)
b→u半レプトニック崩壊率に対する二次QCD寄与
(The second order QCD contribution to the semileptonic b→u decay rate)
森林火災リスク予測の最新動向:深層学習を用いたサーベイ
(Wildfire Risk Prediction: A Survey of Recent Advances Using Deep Learning Techniques)
WSRTによるハッブル深宇宙領域の1.4 GHz観測
(WSRT 1.4 GHz Observations of the Hubble Deep Field)
訓練不要のオープンボキャブラリー音声映像分割
(OpenAVS: Training-Free Open-Vocabulary Audio Visual Segmentation with Foundational Models)
深い非弾性散乱における閉じ込めとスケーリング
(Confinement and scaling in deep inelastic scattering)
関連タグ
この記事をシェア

有益な情報を同僚や仲間と共有しませんか?

AI技術革新 - 人気記事
ブラックホールと量子機械学習の対応
(Black hole/quantum machine learning correspondence)
生成AI検索における敏感なユーザークエリの分類と分析
(Taxonomy and Analysis of Sensitive User Queries in Generative AI Search System)
DiReDi:AIoTアプリケーションのための蒸留と逆蒸留
(DiReDi: Distillation and Reverse Distillation for AIoT Applications)

PCも苦手だった私が

“AIに詳しい人“
として一目置かれる存在に!
  • AIBRプレミアム
  • 実践型生成AI活用キャンプ
あなたにオススメのカテゴリ
論文研究
さらに深い洞察を得る

AI戦略の専門知識を身につけ、競争優位性を構築しませんか?

AIBR プレミアム
年間たったの9,800円で
“AIに詳しい人”として一目置かれる存在に!

プレミア会員になって、山ほどあるAI論文の中から効率よく大事な情報を手に入れ、まわりと圧倒的な差をつけませんか?

詳細を見る
【実践型】
生成AI活用キャンプ
【文部科学省認可】
満足度100%の生成AI講座
3ヶ月後には、あなたも生成AIマスター!

「学ぶ」だけではなく「使える」ように。
経営者からも圧倒的な人気を誇るBBT大学の講座では、3ヶ月間質問し放題!誰1人置いていかずに寄り添います。

詳細を見る

AI Benchmark Researchをもっと見る

今すぐ購読し、続きを読んで、すべてのアーカイブにアクセスしましょう。

続きを読む