4 分で読了
1 views

バグの「自然さ」を再考する:再帰型ニューラルネットワークによる解析

(Exploring the Naturalness of Buggy Code with Recurrent Neural Networks)

さらに深い洞察を得る

AI戦略の専門知識を身につけ、競争優位性を構築しませんか?

AIBR プレミアム
年間たったの9,800円で
“AIに詳しい人”として
一目置かれる存在に!

プレミア会員になって、山ほどあるAI論文の中から効率よく大事な情報を手に入れ、まわりと圧倒的な差をつけませんか?

詳細を見る
【実践型】
生成AI活用キャンプ
【文部科学省認可】
満足度100%の生成AI講座
3ヶ月後には、
あなたも生成AIマスター!

「学ぶ」だけではなく「使える」ように。
経営者からも圧倒的な人気を誇るBBT大学の講座では、3ヶ月間質問し放題!誰1人置いていかずに寄り添います。

詳細を見る

田中専務

拓海先生、お忙しいところすみません。部下から『コードのバグは「不自然な書き方」で見つかる』と聞いて驚きました。これって要するに、機械が文章の違和感を見つけるのと同じようにコードの違和感を見つけられるということですか?

AIメンター拓海

素晴らしい着眼点ですね!その通りです。研究では、人が読む自然言語の「違和感」に相当する指標を、ソースコードに対して機械で計算してバグを検出できるかを調べているんですよ。

田中専務

なるほど。ただ、我々の現場は古いコードが多く、パターンもばらばらです。投資対効果の観点で、本当に導入する価値がありますか?

AIメンター拓海

大丈夫、一緒に評価すれば必ずできますよ。要点は三つです。第一に、モデルは過去のコードから『よくある書き方』を学ぶこと、第二に、その観点から外れた行を高いエントロピー(不確実性)として検出すること、第三に、それを優先順位付けに使えば検査工数を減らせることです。

田中専務

ほう、過去のコードから学ぶということは、我々の古いリポジトリでも学習は可能ということですね。ただ、具体的にはどんな技術が良いのですか?

AIメンター拓海

ここが肝心ですね。昔は『n-gram(エヌグラム)言語モデル』が多かったのですが、今回の研究は『LSTM(Long Short-Term Memory)長短期記憶』と呼ぶ再帰型ニューラルネットワークを使っています。簡単に言えば、遠く離れた関係も覚えられる仕組みです。

田中専務

これって要するに、関係性の遠い部分まで覚えられるから、大きな関数やファイルでもおかしな所を見つけやすくなるということですか?

AIメンター拓海

その通りですよ。良い理解です。加えて、研究では『エントロピー(entropy)』という数値でその『違和感』を定量化しており、高いエントロピーは『モデルから見て予測しにくい行』、すなわちバグの候補になりうるとしています。

田中専務

実務では誤検知も怖いです。検出したものを全部調べる余力はありません。誤検知を減らす工夫や評価はどうしているのですか?

AIメンター拓海

良い質問です。研究では評価にAUC(Area Under the Curve、曲線下面積)を使っており、LSTMは従来のn-gramモデルに比べてわずかに高いAUCを示しました。運用では閾値を調整して上位から優先的にレビューする運用設計が現実的です。

田中専務

つまり、すべてを自動で直すのではなく、検査の優先順位を付けるのが現実的だと。わかりました、最後に要点を私の言葉で整理してもよろしいですか?

AIメンター拓海

ぜひお願いします。どんな表現でも構いませんから、自分の言葉でまとめてくださいね。

田中専務

承知しました。要するに、過去のコードから『普通の書き方』を学ばせて、そこから外れる場所を機械が高い『違和感スコア』として示す。重要な箇所だけを上から点検する運用にすれば、工数を抑えつつバグ発見の効率が上がる、ということですね。

監修者

阪上雅昭(SAKAGAMI Masa-aki)
京都大学 人間・環境学研究科 名誉教授

論文研究シリーズ
前の記事
単一画像の被写界深度にも効く濃霧除去の新潮流
(A Cascaded Convolutional Neural Network for Single Image Dehazing)
次の記事
嚢胞性線維症における肺異常の定量化
(Quantification of Lung Abnormalities in Cystic Fibrosis using Deep Networks)
関連記事
CANDELS VISUAL CLASSIFICATIONS: SCHEME, DATA RELEASE, AND FIRST RESULTS
(CANDELSの可視的分類:方式、データ公開、初期結果)
グループ等変性ニューラルネットワークの計算効率を改善する図式的アプローチ
(A Diagrammatic Approach to Improve Computational Efficiency in Group Equivariant Neural Networks)
性格検査の内容妥当性評価における人間の専門性と大規模言語モデル埋め込みの比較
(Comparing Human Expertise and Large Language Models Embeddings in Content Validity Assessment of Personality Tests)
流れゆく未知に対する回復力:データストリームのためのオープンセット認識フレームワーク
(Resilience to the Flowing Unknown: an Open Set Recognition Framework for Data Streams)
ピンイン表記の中国名に対する性別推定—For the Misgendered Chinese in Gender Bias Research: Multi-Task Learning with Knowledge Distillation for Pinyin Name-Gender Prediction
モダリティ整合による教師なし音声映像分割
(Unsupervised Audio-Visual Segmentation with Modality Alignment)
関連タグ
この記事をシェア

有益な情報を同僚や仲間と共有しませんか?

AI技術革新 - 人気記事
ブラックホールと量子機械学習の対応
(Black hole/quantum machine learning correspondence)
生成AI検索における敏感なユーザークエリの分類と分析
(Taxonomy and Analysis of Sensitive User Queries in Generative AI Search System)
DiReDi:AIoTアプリケーションのための蒸留と逆蒸留
(DiReDi: Distillation and Reverse Distillation for AIoT Applications)

PCも苦手だった私が

“AIに詳しい人“
として一目置かれる存在に!
  • AIBRプレミアム
  • 実践型生成AI活用キャンプ
あなたにオススメのカテゴリ
論文研究
さらに深い洞察を得る

AI戦略の専門知識を身につけ、競争優位性を構築しませんか?

AIBR プレミアム
年間たったの9,800円で
“AIに詳しい人”として一目置かれる存在に!

プレミア会員になって、山ほどあるAI論文の中から効率よく大事な情報を手に入れ、まわりと圧倒的な差をつけませんか?

詳細を見る
【実践型】
生成AI活用キャンプ
【文部科学省認可】
満足度100%の生成AI講座
3ヶ月後には、あなたも生成AIマスター!

「学ぶ」だけではなく「使える」ように。
経営者からも圧倒的な人気を誇るBBT大学の講座では、3ヶ月間質問し放題!誰1人置いていかずに寄り添います。

詳細を見る

AI Benchmark Researchをもっと見る

今すぐ購読し、続きを読んで、すべてのアーカイブにアクセスしましょう。

続きを読む