伝統中医学の知識検索と診断を可能にするOpenTCM — OpenTCM: A GraphRAG-Empowered LLM-based System for Traditional Chinese Medicine Knowledge Retrieval and Diagnosis

田中専務

拓海先生、最近うちの若手から『OpenTCM』って論文を参考にすれば医療データの扱い方が変わるって聞いたんですが、要するに何が新しいんですか?うちの現場にも使えるんでしょうか。

AIメンター拓海

素晴らしい着眼点ですね!OpenTCMは伝統中医学(Traditional Chinese Medicine、TCM)という膨大で古いテキスト群を、知識グラフ(Knowledge Graph、KG)に整理して、GraphRAGという手法で大規模言語モデル(Large Language Model、LLM)に“取り出しながら答えさせる”仕組みなんですよ。大丈夫、一緒に整理していきましょう。

田中専務

TCMって昔の医書でしょう。それをコンピュータが扱える形にするのが大変だと聞いていますが、GraphRAGってのは具体的に何をするのですか。難しそうで、うちの現場の人が使えるか心配です。

AIメンター拓海

いい質問です。GraphRAGはRetrieval-Augmented Generation(RAG、検索強化生成)の一種で、ここではGraphRAGと呼ばれる『知識グラフを検索して、その根拠をもとに言語モデルが回答を作る方式』です。身近な例で言うと、百科事典の索引から該当ページを取り出して、その根拠を添えて答える仕組みですよ。要点は三つ、1) 古い文章を構造化する、2) 検索して根拠を渡す、3) モデルは追加学習不要で動く、です。

田中専務

これって要するに、膨大な古いテキストを人が読み解いて整理した“索引”を使うから、AIが勝手なことを言いにくくなるということですか?投資対効果の点で無駄な学習を減らせるなら興味があります。

AIメンター拓海

その通りです。専門用語の“幻覚(hallucination)”を減らすために、まず人やドメイン特化モデルでテキストから高精度に情報を抽出し知識グラフを作る点が肝心です。コスト面では、大規模モデルをゼロからファインチューニング(fine-tuning、追加学習)する代わりに、既存のモデルに必要な根拠だけ渡して使うので効率的に運用できますよ。大丈夫、一緒に段取りをつくれば導入は可能です。

田中専務

現場に落とすときの不安は、結局『現場が信頼できるか』という点です。TCMは古い中国語で書かれていると聞きますが、その意味をちゃんと取り出せるんでしょうか。それが怪しいと現場が使いませんよ。

AIメンター拓海

重要な指摘です。OpenTCMは古典テキストの抽出段階でドメイン専門家の検証を入れており、さらにドメイン適応(domain-adapted)した小規模なモデルやカスタムプロンプトで意味を高忠実度に抽出する工夫をしています。つまり、人と機械の両方のチェックを組み合わせて信頼性を担保するアプローチです。安心材料は三つ、専門家検証、構造化、根拠提示です。

田中専務

それなら現場でも使えるかもしれない。うちの投資でやるなら最初はどこから手を付ければ良いですか。まず何が必要でしょうか。

AIメンター拓海

簡潔に三点です。第一に、対象ドキュメントを整理する小さなパイロットプロジェクトでデータの品質を確認すること。第二に、知識グラフに必要な主要エンティティ(成分、症状、処方など)を定義すること。第三に、現場が使うUIの最小実装を作って実運用で信頼性を検証することです。段階的に投資するのでリスクは抑えられますよ。

田中専務

分かりました。要するに『専門家が監修した索引を作って、その索引を使って既存のAIに根拠を与える』という流れですね。ちょっと安心しました。では社内の会議で説明できるよう、私の言葉でまとめてみます。

AIメンター拓海

素晴らしいまとめですね!ぜひその調子で進めましょう。ご不明点はいつでも相談してください。大丈夫、一緒にやれば必ずできますよ。

1. 概要と位置づけ

結論を先に述べる。OpenTCMは、古典的な伝統中医学(Traditional Chinese Medicine、TCM)文献という膨大かつ曖昧な知識資源を、構造化された知識グラフ(Knowledge Graph、KG)として整理し、そのグラフを検索根拠として大規模言語モデル(Large Language Model、LLM)に与えることで、診断補助や検索回答における信頼性と効率を同時に改善した点で従来技術と一線を画す。特に、事前の大規模な追加学習(fine-tuning)を必要とせず、運用コストを抑えて現場利用可能な精度を実現した点が最大の貢献である。

まず基礎として、TCMの知識は分散し、古典中国語や時代背景に依存するため、そのままでは現代の自動処理が不得手である。OpenTCMは68の婦人科関連古典書から3.73百万字を抽出し、専門家検証を経てエンティティと関係を抽出して48,000以上のエンティティと152,000以上の関係を持つKGを構築した点を起点とする。これは単なるコーパス提供ではなく、現場で再利用可能な“索引”を作った点が重要である。

次に応用面では、知識グラフに基づく検索強化生成(GraphRAG)を通じて、LLMが出力する診断や説明に必ず根拠を添付できるようになっている。これにより、医療現場で問題となるモデルの“幻覚(hallucination、根拠のない出力)”を抑制できる。結果として、医師や専門家が迅速に根拠を検証できるため、実運用での採用障壁が下がる。

位置づけとしては、一般的な汎用LLMの直接適用と、専門家による全面的な注釈付きデータ作成の中間に位置する。前者は安全性が懸念され、後者はコストが高い。OpenTCMは構造化と検索の組合せで両者の妥協点を目指した方式であり、ドメイン特化のナレッジベースを効率的に活用する現実的な設計である。

最後に、経営的観点から言えば、段階的な投資で価値を検証できる点が実務上の利点である。まず少量の高品質データでパイロットを回し、信頼性を確認した段階で拡張することで、投資対効果を管理しやすく設計されている。

2. 先行研究との差別化ポイント

従来研究の多くは、汎用LLMに大量データを追加学習させるか、限定的な注釈付きデータでモデルを微調整する方向であった。これらは前者が安全性問題を抱え、後者がコスト高というトレードオフを内包している。OpenTCMは知識グラフを検索根拠として用いるGraphRAGを採用し、追加学習を最小化することでそのトレードオフを回避した点が差別化要素である。

また、古典中国語の解釈や専門用語の曖昧性に対しては、単純なテキスト埋め込み(embedding)だけでは不十分である。OpenTCMはドメイン適応(domain-adapted)した小規模モデルやカスタムプロンプトを組み合わせ、意味抽出の高忠実度化を図っている。これは単なるコーパス整備に留まらない、意味レベルの構造化を目指した点で先行研究と違う。

さらに、知識グラフのスキーマ設計においては、成分・症状・処方などTCM特有の多対多関係を明示的にモデル化しており、複雑な関係性をグラフ構造で表現できる。これにより、単純検索やキーワードマッチでは捉えられない推論的質問にも対応可能である点が評価できる。

運用面の差別化も重要である。OpenTCMは専門家の検証プロセスをワークフローに組み込み、KG更新時に人が介在することで信頼性を維持する設計になっている。これは完全自動のパイプラインよりも現場受容性が高い構成である。

最後に、コスト効率の観点では、既存の大規模モデルをそのまま活用可能にする設計が、初期投資を抑えながら実用性を担保する現実的なアプローチである点が、事業判断の際の決め手となる。

3. 中核となる技術的要素

OpenTCMの中核は三つの工程で構成される。第一にデータ収集と前処理である。古典書をデジタル化し、古典中国語の表記ゆれや断片化を整理して正規化する。ここでの工夫は、現代語訳や注記ではなく原典の意味構造を保ったまま抽出する点であり、人手による検証が重要である。

第二に知識グラフ(Knowledge Graph、KG)の構築である。エンティティ(ingredients、symptoms、treatmentsなど)と多様な関係を定義し、実際の文献から高忠実度に抽出した事実をノードとエッジとして格納する。これにより、TCMの複雑な相互関係を機械が扱いやすい形に変換する。

第三にGraphRAG(Graph-based Retrieval-Augmented Generation)を用いた検索強化生成である。ここではKGから関連ノードを取り出し、その根拠テキストや関係をLLMに渡して回答生成を行う。LLM側は追加学習を必ずしも必要とせず、与えられた根拠に基づいて説明可能な回答を生成する点が特徴である。

また、意味抽出にはドメイン適応(domain-adapted)モデルやカスタムプロンプトを用いており、古典特有の表現や語義を誤解しないように設計されている。これは単純なキーワード抽出よりも信頼性が高く、誤ったリンク付けを減らす効果がある。

最後に、システム全体は人と機械の協調ワークフローを前提としている。KGの更新やモデル出力の検証に専門家が介在することで、運用時の安全性と現場受容性を高める構成となっている。

4. 有効性の検証方法と成果

OpenTCMは有効性を示すために、データ品質、抽出精度、そして最終的な診断補助の精度という三つの観点で検証を行っている。データ品質では、68冊の古典書から抽出したテキストを専門家が検証し、エンティティや関係の整合性を担保した点がまず挙げられる。

抽出精度の検証では、カスタムプロンプトやドメイン適応モデルを用いた意味抽出の正確さを、専門家ラベルと比較して評価している。報告されている成果は、高忠実度でのエンティティ抽出と関係抽出が実現できたことだ。これによりKGの基礎的品質が確保された。

診断補助や質問応答の評価では、GraphRAGを介したLLM出力が根拠となる文献やKGノードを提示できる点が強調される。これは単に回答の正否を測るだけでなく、説明可能性(explainability)を実現するという点で臨床応用上重要である。

さらに計算資源の面で、完全な追加学習を行うことなく既存LLMを利用できるため、実運用での計算負荷とコストを抑制できるという結果が示されている。これは現場導入のハードルを下げる実務的な利点である。

総じて、OpenTCMはデータ整備と検索根拠の両輪で信頼性を担保しつつ、実運用を視野に入れた評価設計によって有効性を示している。

5. 研究を巡る議論と課題

議論点の一つは、知識グラフ自体の完全性と更新性である。古典文献は専門家による解釈が分かれることがあり、KGに固定化する際の判断が結果に影響を与える。従って、KG設計には継続的な専門家レビューとバージョン管理が不可欠である。

もう一つの課題は、LLMが提供する解釈の信頼度評価である。GraphRAGは根拠を渡すことで幻覚を抑えるが、根拠の解釈自体が誤っていると誤情報が流れる可能性が残る。これを防ぐには、根拠提示の粒度と専門家チェックポイントを慎重に設計する必要がある。

また、法規制や倫理面の配慮も議論として残る。医療情報を扱う際には地域ごとの規制や現場での説明責任が重要であり、システム設計にこれらを組み込む必要がある。運用時には明確な責任分界を定めるべきである。

計画的なスケーラビリティも検討課題だ。初期は婦人科関連に限ったが、他領域へ拡張する際にはエンティティスキーマの再設計や追加専門家の投入が必要となる。ここでのコストと効果のバランスが事業化の鍵を握る。

最後に、ユーザーインターフェース設計と現場教育の重要性が指摘される。技術的に正しくても、現場が使いこなせなければ価値は出ないため、導入計画には運用教育と段階的改善が欠かせない。

6. 今後の調査・学習の方向性

今後は第一に、知識グラフの自動的な更新と専門家レビューの統合ワークフローを整備する研究が必要である。具体的には、変更履歴を残しつつ専門家の判断を取り入れる仕組みを作ることが、長期運用の安定性に寄与する。

第二に、根拠提示の最適化である。どの程度の文献根拠を提示すれば現場の信頼を得られるか、ユーザビリティと説明可能性のトレードオフを定量的に評価する研究が求められる。これは実運用データによる検証が不可欠である。

第三に、他ドメインへの汎用化である。TCMで得られた知見を一般医療や製造業のナレッジ活用に応用するため、エンティティ設計やGraphRAGの適用性を検討することが望ましい。ドメイン特化のカスタマイズ指針を整備することが重要だ。

第四に、運用コストとROI(Return on Investment、投資対効果)の長期評価である。段階的導入モデルにおいて、どの時点で人手削減や業務効率化が実現されるかを定量化する必要がある。これが経営判断に直結する。

最後に、実務者向けの教育コンテンツとガバナンス設計を同時に進めること。技術だけでなく運用面の整備がなければ現場導入は進まないため、事業化を視野に入れた包括的な取り組みが求められる。

検索に使える英語キーワード: OpenTCM, GraphRAG, Knowledge Graph, Traditional Chinese Medicine, Retrieval-Augmented Generation, domain-adapted LLM

会議で使えるフレーズ集

「OpenTCMの肝は『知識グラフを根拠に与えることで、LLMの出力に説明可能性を持たせる点』です。」

「段階的に投資してパイロットで品質を確認し、専門家レビューを組み込む運用設計によりリスクを抑えられます。」

「ファインチューニングを大規模に行うより既存モデルに根拠を渡す方が初期コストは低く、実務適用が速いです。」

J. He et al., “OpenTCM: A GraphRAG-Empowered LLM-based System for Traditional Chinese Medicine Knowledge Retrieval and Diagnosis,” arXiv preprint arXiv:2504.20118v3, 2025.

AIBRプレミアム

関連する記事

AI Business Reviewをもっと見る

今すぐ購読し、続きを読んで、すべてのアーカイブにアクセスしましょう。

続きを読む