4 分で読了
1 views

建設管理

(CM)をAIは習得できるか:CM認定試験に対する最先端大規模言語モデルのベンチマーク (Can AI Master Construction Management (CM)? Benchmarking State-of-the-Art Large Language Models on CM Certification Exams)

さらに深い洞察を得る

AI戦略の専門知識を身につけ、競争優位性を構築しませんか?

AIBR プレミアム
年間たったの9,800円で
“AIに詳しい人”として
一目置かれる存在に!

プレミア会員になって、山ほどあるAI論文の中から効率よく大事な情報を手に入れ、まわりと圧倒的な差をつけませんか?

詳細を見る
【実践型】
生成AI活用キャンプ
【文部科学省認可】
満足度100%の生成AI講座
3ヶ月後には、
あなたも生成AIマスター!

「学ぶ」だけではなく「使える」ように。
経営者からも圧倒的な人気を誇るBBT大学の講座では、3ヶ月間質問し放題!誰1人置いていかずに寄り添います。

詳細を見る

田中専務

拓海先生、最近うちの若手が「AIを試験問題で評価すべき」と言っているのですが、正直ピンと来ません。建設管理(CM)でAIがどこまで使えるんでしょうか?

AIメンター拓海

素晴らしい着眼点ですね!まず結論を端的に言うと、今回の研究は「大規模言語モデル(LLM/Large Language Model)は建設管理の知識を部分的に補助できるが、現場の定量的判断や規制解釈で限界がある」と示しているんですよ。

田中専務

要するに、書類の読み取りや相談窓口には使えても、予算や工程の細かい計算までは任せられないということですか?

AIメンター拓海

いい質問です、田中専務。結論を3点でまとめますよ。1) LLMは知識の検索と説明に強みがある、2) 定量的な精密計算や最新規制の解釈では誤答やあいまいさが出る、3) 教育や現場の補助ツールとしては有用だ、ということです。一緒に具体例を見ていきましょう。

田中専務

そもそも、どうやってAIの実力を測ったんですか。うちの現場で使う前に、きちんと評価してくれているのか気になります。

AIメンター拓海

素晴らしい着眼点ですね!研究者はまずベンチマーク(benchmark)を作りました。CMExamSetという、実際のCM資格試験から集めた689問の選択式問題です。これをAIに解かせて、正答率や間違いの傾向を分析しているんです。

田中専務

689問ですか。それは本気の試験素材ですね。で、結果はどんな感じでしたか?それで実務に使えるかどうかがわかるんですか?

AIメンター拓海

良い質問です。研究ではゼロショット評価(zero-shot evaluation)という方法で、AIに追加の学習をさせずに問題を解かせました。得点は分野や問題の難易度でばらつきがあり、特に数値計算や規制の厳密な解釈で弱点が見えました。ただし説明の生成や選択肢の選び方では有用な助言を出す場合が多かったです。

田中専務

これって要するに、AIは『知識ベースの相談員』にはなるが、『現場の責任を取る判断者』にはならない、ということですか?

AIメンター拓海

その通りですよ!大事なのは役割定義です。AIは情報の検索、初期案の提示、教育教材の生成で力を発揮するが、最終判断や安全責任は人間が維持するのが現実的です。導入の際は、期待値を明確にして、小さな実証(PoC)で投資対効果を検証するのがおすすめです。

田中専務

投資対効果ですね。具体的には現場でどこから手を付ければいいですか。教育、図面解説、それとも工程管理の自動化でしょうか。

AIメンター拓海

大丈夫、一緒にやれば必ずできますよ。優先順位はまず教育と意思決定支援からです。ドキュメント要約や過去の事例検索で時間を節約し、次に定型的なチェックリストや報告書の自動生成へ広げるのが投資効果が見えやすいです。工程の自動化や精密計算はデータ整備と検証が必須なので段階的に進めると良いです。

田中専務

分かりました。つまり、まずは教育とナレッジ検索で効率化して、重大な判断は人間が保持する。段階的に精度とデータ整備を進める、ということですね。自分の言葉で言うと、AIは『賢いアシスタント』であって、『責任を取る監督』ではない、と理解しました。

監修者

阪上雅昭(SAKAGAMI Masa-aki)
京都大学 人間・環境学研究科 名誉教授

論文研究シリーズ
前の記事
自律型GISに向けた研究アジェンダ:人工知能時代のGIScience
(GIScience in the Era of Artificial Intelligence: A Research Agenda Towards Autonomous GIS)
次の記事
ライム病論争のAI駆動ディスコース分析 — AI-Driven Discourse Analysis of the Lyme Disease Controversy
関連記事
物体運動に導かれたヒト運動合成
(Object Motion Guided Human Motion Synthesis)
不可視画像透かしの除去に関する基準手法
(A Baseline Method for Removing Invisible Image Watermarks using Deep Image Prior)
非凸行列分解による低ランク解の発見 — Finding Low-Rank Solutions via Non-Convex Matrix Factorization, Efficiently and Provably
敵対的損失による非パラメトリック密度推定
(Nonparametric Density Estimation with Adversarial Losses)
CanvoX:大規模ボリューメトリックキャンバスにおける高解像度VRペインティング
(CanvoX: High-resolution VR Painting in Large Volumetric Canvas)
認知超音波のための能動推論と深層生成モデリング
(Active inference and deep generative modeling for cognitive ultrasound)
この記事をシェア

有益な情報を同僚や仲間と共有しませんか?

AI技術革新 - 人気記事
ブラックホールと量子機械学習の対応
(Black hole/quantum machine learning correspondence)
DiReDi:AIoTアプリケーションのための蒸留と逆蒸留
(DiReDi: Distillation and Reverse Distillation for AIoT Applications)
生成AI検索における敏感なユーザークエリの分類と分析
(Taxonomy and Analysis of Sensitive User Queries in Generative AI Search System)

PCも苦手だった私が

“AIに詳しい人“
として一目置かれる存在に!
  • AIBRプレミアム
  • 実践型生成AI活用キャンプ
あなたにオススメのカテゴリ
論文研究
さらに深い洞察を得る

AI戦略の専門知識を身につけ、競争優位性を構築しませんか?

AIBR プレミアム
年間たったの9,800円で
“AIに詳しい人”として一目置かれる存在に!

プレミア会員になって、山ほどあるAI論文の中から効率よく大事な情報を手に入れ、まわりと圧倒的な差をつけませんか?

詳細を見る
【実践型】
生成AI活用キャンプ
【文部科学省認可】
満足度100%の生成AI講座
3ヶ月後には、あなたも生成AIマスター!

「学ぶ」だけではなく「使える」ように。
経営者からも圧倒的な人気を誇るBBT大学の講座では、3ヶ月間質問し放題!誰1人置いていかずに寄り添います。

詳細を見る

AI Benchmark Researchをもっと見る

今すぐ購読し、続きを読んで、すべてのアーカイブにアクセスしましょう。

続きを読む