2025.11.18

論文研究

6 分で読了

1 views

プロンプトが全て：大規模言語モデルによる自動Androidバグ再現

（Prompting Is All You Need: Automated Android Bug Replay with Large Language Models）

#LLM

- メールで送る
- リンクをコピーする

AI戦略の専門知識を身につけ、競争優位性を構築しませんか？

AIBR プレミアム

年間たったの9,800円で

“AIに詳しい人”として
一目置かれる存在に！

プレミア会員になって、山ほどあるAI論文の中から効率よく大事な情報を手に入れ、まわりと圧倒的な差をつけませんか？

詳細を見る

【実践型】
生成AI活用キャンプ

【文部科学省認可】
満足度100%の生成AI講座

3ヶ月後には、
あなたも生成AIマスター！

「学ぶ」だけではなく「使える」ように。
経営者からも圧倒的な人気を誇るBBT大学の講座では、3ヶ月間質問し放題！誰1人置いていかずに寄り添います。

詳細を見る

田中専務

拓海先生、お忙しいところ失礼します。最近、部下から「AIでバグの再現を自動化できる」と聞いて驚いたのですが、本当にそんなことが可能なのでしょうか。投資に見合う効果があるのか、まずは要点を教えていただけますか。

AIメンター拓海

素晴らしい着眼点ですね！結論から言うと、この研究は「バグ報告から人手をほとんど使わずに実際の操作を再現する」仕組みを示していますよ。要点は三つです。一、既存の大規模言語モデル（Large Language Models (LLMs) 大規模言語モデル）を訓練せずにうまく使うこと。二、画面情報をテキスト化してモデルに理解させる工夫。三、少ない例（few-shot learning）や思考過程の誘導（Chain-of-Thought reasoning）を用いて複雑な手順を生成することです。大丈夫、一緒にやれば必ずできますよ。

田中専務

なるほど、三つのポイントですね。ただ、現場で使えるかは別問題です。例えば我が社の製品は画面が複雑で、特殊なボタンや画像を使っています。そうしたケースでもこの方法は効くのでしょうか。

AIメンター拓海

良い質問ですね。ここでの肝は「GUI encoding（画面のテキスト化）」にあります。研究では画面の階層情報をHTML風のテキストに変換し、モデルがウェブページ文脈で学習している分布に近づける工夫をしています。画像や特殊部品はテキストでどう説明するかが鍵ですが、画像のラベル化や要素の説明を加えることで多くの場合は対応可能です。大切なのは、モデルに『人間が見てわかる形で』画面を示すことですよ。

田中専務

これって要するにバグ報告の文章をうまく書き換えて、AIに操作手順を考えさせるということですか。とにかく人が画面を説明してやれば再現できる、という理解で合っていますか。

AIメンター拓海

要するにその通りですよ。ただ厳密には『人が詳細な画面情報を全部書かなくても、いい例を少しだけ示せばモデルが残りを補完できる』のがポイントです。研究はfew-shot learning（few-shot learning）少数例学習を使い、モデルに例を見せてから新しい報告を入力します。その結果、モデルは画面上のどの要素を押すべきかを推論して操作手順を生成するのです。安心してください、できないことはない、まだ知らないだけです。

田中専務

投資対効果の観点で伺います。これを導入して本当に工数や時間が減るのでしょうか。例えば不具合報告の再現にかかる平均時間はどの程度改善するのですか。

AIメンター拓海

良い視点ですね。研究の評価では、AdbGPTという手法で約81.3%のバグ報告を自動再現でき、平均で約253.6秒で再現に至ったと報告されています。これは従来の自動化手法より高い再現率と短い時間を示しています。もちろん現場ごとの調整は必要で、まずはパイロットで重要な10〜20件を試験するのが現実的です。要点を三つにまとめると、初期導入は小さく、評価でROIを評価し、その後スケールする流れが合理的です。

田中専務

セキュリティや顧客情報の取り扱いも気になります。クラウドに上げるのは怖いのですが、オンプレミスでの運用やデータの匿名化は可能ですか。

AIメンター拓海

大事な点ですね。技術的には二通りの運用が可能です。一つはクラウドのLLMをプロキシ的に使う方法で、導入が早いがデータ送信リスクがある。二つ目はモデルを社内にホストするか、小さなモデルで同様の手続き（プロンプト設計）を行う方法で、こちらは安全性が担保しやすいです。また、個人情報や機密部分は前処理でマスクするワークフローを入れることが現実的です。どちらを選ぶかはコストとリスクのバランス次第ですよ。

田中専務

これを社内で回すために、現場のエンジニアには何をしてもらえばいいですか。大がかりな学習や環境構築が必要なら現実的ではないと感じますが。

AIメンター拓海

安心してください。AdbGPTの利点は『学習なしでプロンプト（指示）を工夫するだけで動く』点です。現場では、画面の情報を取得する自動化スクリプトと、生成された操作手順を実行するリプレイモジュールが必要になりますが、これは既存のテスト自動化の延長で実装できます。初期はエンジニアがプロンプトの微調整と画面エンコーディングを確認すれば回ります。失敗を学習のチャンスと捉え、段階的に安定化させるのが現実的な進め方ですよ。

田中専務

分かりました。要点を私の言葉でまとめますと、まずは重要な不具合数件で小さく試して効果を見る。画面情報をテキスト化してAIに渡し、AIが操作手順を出すのを現場で検証する。最終的には時間短縮と再現率向上によるコスト削減が期待できる、という理解で良いですか。

AIメンター拓海

その理解で完璧ですよ。素晴らしい着眼点ですね！最初は小さく、そして成果が出たらちゃんと社内で運用ルールを作ってスケールすればいいのです。大丈夫、一緒にやれば必ずできますよ。

田中専務

では早速、来週の役員会で試験導入の提案を出します。拓海先生、ご助言ありがとうございました。

PCも苦手だった私が

“AIに詳しい人“
として一目置かれる存在に！

論文研究

プロンプトが全て：大規模言語モデルによる自動Androidバグ再現

さらに深い洞察を得る

AIBR プレミアム

“AIに詳しい人”として
一目置かれる存在に！

【実践型】
生成AI活用キャンプ

3ヶ月後には、
あなたも生成AIマスター！

論文研究シリーズ

AI技術革新 - 人気記事

“AIに詳しい人“
として一目置かれる存在に！

あなたにオススメのカテゴリ

さらに深い洞察を得る

AIBR プレミアム

“AIに詳しい人”として一目置かれる存在に！

【実践型】
生成AI活用キャンプ

3ヶ月後には、あなたも生成AIマスター！

プロンプトが全て：大規模言語モデルによる自動Androidバグ再現

さらに深い洞察を得る

AIBR プレミアム

“AIに詳しい人”として一目置かれる存在に！

【実践型】 生成AI活用キャンプ

3ヶ月後には、あなたも生成AIマスター！

論文研究シリーズ

関連記事

関連タグ

この記事をシェア

AI技術革新 - 人気記事

“AIに詳しい人“として一目置かれる存在に！

あなたにオススメのカテゴリ

さらに深い洞察を得る

AIBR プレミアム

“AIに詳しい人”として一目置かれる存在に！

【実践型】 生成AI活用キャンプ

3ヶ月後には、あなたも生成AIマスター！

AI Benchmark Researchをもっと見る

“AIに詳しい人”として
一目置かれる存在に！

【実践型】
生成AI活用キャンプ

3ヶ月後には、
あなたも生成AIマスター！

“AIに詳しい人“
として一目置かれる存在に！

【実践型】
生成AI活用キャンプ