長文・構造化文書に対する問答手法の提案(PDFTriage: Question Answering over Long, Structured Documents)

田中専務

拓海先生、最近部下から「長いPDFをAIに読ませて質問させれば仕事が楽になる」と言われているのですが、正直ピンと来ません。どこがどう変わるのか、端的に教えていただけますか。

AIメンター拓海

素晴らしい着眼点ですね!大丈夫です、簡単にイメージできますよ。結論を先に言うと、この技術は長くてページや表が多い文書を、構造を失わずに必要な部分だけ取り出してAIで答えさせられるようにするものです。要点は三つにまとめられますよ。

田中専務

三つですか。具体的にはどんな三つですか。現場で使えるかどうか、投資対効果をすぐ判断したいのです。

AIメンター拓海

一つ目は文書の構造をそのまま使う点です。二つ目は質問に対してまず『どのページや表を見ればいいか』をAI自身が選ぶこと、三つ目は選んだ部分で初めて回答を生成する工程を分けていることです。これで無駄に全文を読み込ませるコストを下げられますよ。

田中専務

要するに、長い報告書を丸ごとAIに食わせてあれこれ聞くのではなく、必要なページや表だけを先に選んでから答えさせるということですか。これって要するに無駄を省くという話ですか?

AIメンター拓海

まさにその通りです!素晴らしい着眼点ですね!少しだけ補足すると、ここで使う『AI』は大型言語モデル(LLM: Large Language Model、大型言語モデル)で、文脈を理解して文章を生成する能力があります。ただしLLMは一度に扱える情報量(コンテキスト長)に限りがあるため、全部を一気に渡すと精度が落ちたりコストが大きくなったりしますよ。

田中専務

なるほど。コストと精度のトレードオフが問題になるわけですね。で、現場で運用するにはどのくらい手間がかかりますか。うちの現場はクラウドも苦手でして。

AIメンター拓海

安心してください。手順は三段階で整理されており、それぞれ運用ルールを作れば現場負荷は抑えられますよ。まず文書からページや表、セクションといった構造情報(ドキュメントメタデータ)を抽出します。次にそのメタデータを使ってAIが候補部分を選び、最後に選ばれた部分だけで回答を作ります。これでクラウドの負担も限定的にできます。

田中専務

つまり、まずは文書を目次や表ごとに分けて目次代わりのメタデータを作る。それをAIが見て「ここ」と指さす、と。社内向けにやるならそこをルール化すれば良さそうですね。

AIメンター拓海

その通りです。運用面で重要なのは三つだけです。メタデータの形式を決めること、AIに選ばせる基準(たとえばページ単位かセクション単位か)を明確にすること、そして選んだ情報を人間が確認する仕組みを入れることです。これだけで導入リスクが大きく下がりますよ。

田中専務

分かりました。要するに、長い文書でも目的に沿った箇所をAIに探させ、その結果を人がチェックすることで実務に使える形にする、ということですね。自分の言葉で言うと、まず目利きをAIにさせて、その後で人が最終確認する工場の検品と同じ流れだ、という理解で合っていますか。

AIBRプレミアム

関連する記事

AI Business Reviewをもっと見る

今すぐ購読し、続きを読んで、すべてのアーカイブにアクセスしましょう。

続きを読む