ドメイン文書から要求へ:宇宙産業におけるRetrieval-Augmented Generation(RAG) From Domain Documents to Requirements: Retrieval-Augmented Generation in the Space Industry

田中専務

拓海さん、最近部下から「RAGが要求定義を楽にする」と聞いたのですが、何のことかさっぱりでして。うちみたいな中小でも使えるんでしょうか。

AIメンター拓海

素晴らしい着眼点ですね!RAG(Retrieval-Augmented Generation、検索補強生成)は大量の文書から必要な情報を取り出し、生成モデルで取りまとめる仕組みですよ。要点は三つ、情報を探す、自動でまとめる、安全性を担保する、です。

田中専務

これって要するに、膨大な仕様書や規格の中から必要な箇所を拾って、雛形の要求仕様を作ってくれるということですか?手作業で数日かかる作業が短縮できる、と。

AIメンター拓海

その理解で正しいです。特に宇宙分野のように文書が膨大で専門語が多い分野では有効ですよ。まずは小さなドキュメントで試して、精度と工数削減を評価するのが現実的です。

田中専務

安全や規格の適合性が最重要な分野で、人手の最終チェックを省けないでしょう?モデルが誤って要件を抜いたり、作りすぎたりしたら怖いです。

AIメンター拓海

おっしゃる通りです。ここでも三点、モデルをそのまま信用しない、人間の検証ループを組み込む、規格参照を自動で示すことが重要です。RAGは関連箇所の根拠を結び付けるため、なぜその要求が出たかのトレーサビリティが得られる点が利点です。

田中専務

うちのような小さな会社が導入する場合、初期投資と期待できる工数削減が気になります。どのぐらい効果が見込めるのですか。

AIメンター拓海

段階的導入が鍵です。まずは一プロジェクトの一部文書で概念実証を行い、人手の何割が削減できるかを計測します。期待効果は文書の質と整理状況によりますが、手作業の要件抽出工数を数十パーセント削減できた事例が報告されていますよ。

田中専務

導入の障害は何が多いですか。現場から抵抗が出ることはありませんか。

AIメンター拓海

現場の不安は「仕事が奪われる」「誤りが混入する」点です。対応として三つ、現場を巻き込む、透明に結果と根拠を示す、徐々に自動化度を上げる、です。最初から全自動を目指さず、チェック支援から始めれば受け入れやすいですよ。

田中専務

分かりました。これって要するに、AIが要件の「下書き」を作って、最終チェックと責任は人間が負うように仕組みを作れば、安全性と効率の両方が取れる、ということですね。

AIメンター拓海

まさにその通りですよ。最初の導入目標を明確に設定し、人がチェックするポイントを設計すれば、投資対効果は見えます。大丈夫、一緒にやれば必ずできますよ。

田中専務

では私の言葉で整理します。RAGで文書から候補となる要求を自動生成し、生成された要求には必ず根拠と参照を付けて現場が検証する。効果測定は段階的に行い、最終判断は人間が行う。まずは小さく試して拡大する、ですね。

AIメンター拓海

素晴らしいまとめです!その理解で現場と経営の橋渡しができますよ。では次回、具体的なPoC(概念実証:Proof of Concept)の設計を一緒にやりましょう。


1.概要と位置づけ

結論から述べる。本研究はRetrieval-Augmented Generation(RAG)(Retrieval-Augmented Generation (RAG)(検索補強生成))を用いて、宇宙産業に特有の膨大かつ半構造化されたドメイン文書から設計要求(Requirements Engineering (RE)(要求工学))の草案を自動生成し、エンジニアの工数を削減しつつ規格適合性の確認を支援する点で大きく前進した。従来は専門家が手作業で文書を読み解き要求を抽出していたが、本手法は文書の分類、関連箇所の検索(semantic retrieval(意味検索))、および大規模言語モデル(Large Language Models (LLMs)(大規模言語モデル))による生成を組み合わせて、要求草案とその根拠を同時に提示できる。これにより、小規模な宇宙機関や新規参入者が、長大な規格やミッションブリーフを起点にした要求作成のハードルを下げられる可能性が示された。特に安全性やコンプライアンスが重要なドメインで、トレーサビリティを維持しつつ工数を削減できる点が本研究の核心である。

技術的には四つの流れが連結される。原資料の前処理とセグメンテーション、文書の分類とラベリング、意味検索に基づく関連情報の抽出、そしてLLMによる要求文生成である。各工程はモジュール化され、異なるドメインや規模に合わせて取り替え可能である。実証は実際のミッション文書を用いて行われ、業界パートナーとの協働に基づく評価が付随している。結果は予備的ではあるが、有望な工数削減と要求カバレッジの向上を示している。結論として、本研究はRAGを用いることでREの一部を半自動化する実務的な道筋を示し、小規模組織の参画障壁を下げる示唆を与える。

2.先行研究との差別化ポイント

先行研究では要求文の自動抽出や仕様書の自動解析が試みられてきたが、多くは文の自動分類やキーワード抽出に留まり、要求の生成とその根拠提示を統合する点が弱かった。従来の自然言語処理(NLP)手法は半構造化文書に対する柔軟性が低く、長大な規格文書の解釈において人的レビューを大幅に削減するには至らなかった。本研究は文書解析の上流から生成の下流までを一連のパイプラインとして設計し、意味検索による証拠の紐付けを明示的に行う点で差別化される。さらに、評価を実務文書で行い、工数削減やカバレッジの改善といった実務的成果を示した点で、理論的検討だけに留まる研究よりも実用に近い位置づけである。要するに、要求の『なぜ』を伴った生成を行い、検証可能性を確保した点が本研究の新規性である。

3.中核となる技術的要素

本パイプラインは四つの技術要素から成る。第一に文書前処理であり、半構造化されたPDFやブリーフを適切に分割し、意味的に一貫した単位に整備する工程である。第二に分類とラベリングで、機能要件、インタフェース仕様、規格準拠箇所などに文書を振り分ける処理を機械学習で行う。第三にsemantic retrieval(意味検索)で、要求候補に関連する規格条項や既往データを高精度で引き当てる能力が重要である。第四にLarge Language Models (LLMs)(大規模言語モデル)を用いた生成で、引き当てた根拠を参照しつつ要求文のドラフトを作成する。各要素は独立性を保ち、ドメイン固有の辞書やルールを追加することで適用範囲を広げられる点が設計思想である。

4.有効性の検証方法と成果

検証は実際のミッション文書を用いたケーススタディで行われ、業界パートナーとの共同評価により人間の作業時間削減や要求カバレッジを定量的に測定した。評価指標としては生成要求の有用性、生成要求に対する参照箇所の妥当性、およびエンジニアによる修正率を採用している。予備結果では、手作業のみと比較して要求抽出工数の削減が確認され、生成要求が初期設計段階での意思決定を支援できることが示された。加えて、RAGの構造により各要求に対する根拠が明示されるため、レビュー時の意見対立を減らし、トレーサビリティが向上した。とはいえ、完全自動化は現実的でなく、人間による最終検証は不可欠であるとの結論であった。

5.研究を巡る議論と課題

議論の焦点は主に安全性、規格の解釈差、そして生成モデルの信頼性にある。自動生成が誤った要求を提示した場合の責任所在や、規格文言の曖昧さが要求設計に与える影響は無視できない。加えて、ドメイン固有の語彙や文書構造が整備されていない組織では、前処理段階でのコストが導入障壁となる。モデルのブラックボックス性に対しては、RAGの検索結果を根拠として提示することで説明可能性を高める方向が取られているが、完全な解決には至っていない。最後に、運用における人間とAIの役割分担の設計が重要であり、現場の受け入れや組織プロセスの調整が不可欠である。

6.今後の調査・学習の方向性

まずは適用可能性の検証を他ドメインへ拡張することが求められる。文書解析、ニューラルラベリング、semantic retrieval(意味検索)、およびLLM生成というコア技術は領域横断的に応用可能であり、航空、医療といった他の安全クリティカル領域でも検討に値する。次に実務導入のためのガバナンス設計として、検証プロトコル、責任分担、及び規格準拠チェックリストの自動生成を整備する必要がある。さらに、モデル評価の標準化とベンチマークの構築が進めば、導入判断がしやすくなる。最終的には、人間中心のレビューを前提にしたハイブリッドワークフローを確立し、小規模組織でも安全にAIを活用できる環境を整備することが目標である。

会議で使えるフレーズ集

「本件はRAG(Retrieval-Augmented Generation、検索補強生成)を用いることで、文書証拠を紐づけた要求草案を短時間で得られるため、レビュー効率が上がると見ています。」

「まずは一案件でPoC(Proof of Concept、概念実証)を実施し、工数削減率と誤検出率を定量的に評価しましょう。」

「AIが出すのは下書きであり、最終責任は人間が持つ運用ルールを確立する点を前提に導入を進める提案です。」


引用元: C. Arora et al., “From Domain Documents to Requirements: Retrieval-Augmented Generation in the Space Industry,” arXiv preprint arXiv:2507.07689v1, 2025.

AIBRプレミアム

関連する記事

AI Business Reviewをもっと見る

今すぐ購読し、続きを読んで、すべてのアーカイブにアクセスしましょう。

続きを読む