2025.04.04

論文研究

4 分で読了

1 views

医療概念の関連性と大規模EHRベンチマーク

（Biomedical Concept Relatedness — A large EHR-based benchmark）

- メールで送る
- リンクをコピーする

AI戦略の専門知識を身につけ、競争優位性を構築しませんか？

AIBR プレミアム

年間たったの9,800円で

“AIに詳しい人”として
一目置かれる存在に！

プレミア会員になって、山ほどあるAI論文の中から効率よく大事な情報を手に入れ、まわりと圧倒的な差をつけませんか？

詳細を見る

【実践型】
生成AI活用キャンプ

【文部科学省認可】
満足度100%の生成AI講座

3ヶ月後には、
あなたも生成AIマスター！

「学ぶ」だけではなく「使える」ように。
経営者からも圧倒的な人気を誇るBBT大学の講座では、3ヶ月間質問し放題！誰1人置いていかずに寄り添います。

詳細を見る

ケントくん

博士、今日はどんな面白いことがあるの？AIってなんだか魔法みたいだよね！

マカセロ博士

今日は医療に役立つAIのお話じゃ。特に、電子健康記録、通称EHRを基にした医療概念の関連性についての論文を紹介するんじゃ。

ケントくん

ふーん、EHRってなに？医療のことならお医者さんがやるもんだと思ってた！

マカセロ博士

EHRは患者の診断や治療の記録をデジタルデータとして管理するものじゃよ。AIを使って、これらの記録から関連性のある医療情報を効率よく見つけることができるんじゃ。

この論文「Biomedical Concept Relatedness — A large EHR-based benchmark」は、電子健康記録（EHR）を用いて医療概念の関連性を測定する新しいベンチマークデータセットを提案するものです。目的は、医療現場において、例えば医師が患者の健康記録から必要な情報を効率的に引き出したり、研究に適した患者を募集する際に役立つ新たな情報検索技術の開発を支援することです。このデータセットは既存の関連性データセットと比べて約6倍の規模を誇り、EHRデータから概念の共起に基づいて選ばれた概念ペアを含む点で、応用に関連性のある設定を反映しています。この新しいデータセットの発表により、関連性予測モデルをより厳密に評価できることが期待され、医療におけるAIの実践的応用を促進します。

この研究が先行研究と比べて特筆すべき点は、データセットの規模と選択プロセスにあります。従来の関連性データセットは、選ばれた概念ペアが少数であったり、手作業で選ばれていたのに対し、この研究ではEHRデータに基づいて自動的に関連性のある概念ペアを選出しました。これにより、より多様で現実的な医療シナリオを反映するデータセットを構築することができました。また、データセットが大規模であるため、機械学習モデルの微妙な性能差をより確実に評価することが可能です。さらに、このデータセットは、これまでのデータセットと補完的な性質を持ち、医療用語のカバレッジが向上しています。

この研究の核となる技術は、EHRから抽出した大規模な医療概念ペアの構築と、それを用いた新しい関連性ベンチマークの策定です。特に、概念の共起に基づいて関連性を定義するアプローチが用いられています。また、データセット構築の過程で、複数のアノテータを用いて概念対の関連性をスコアリングし、高品質なデータを確保しました。これにより、概念の関連性を高精度で判断する基盤が整えられています。

この新しいデータセットの有効性は、既存の最先端埋め込み技術を用いて概念関連性の予測を行い、そのパフォーマンスを測定することで検証されました。その結果、EHR-RelBデータセットは他のデータセットに比べて性能が低下することが確認されましたが、これは主に複数語から成る概念が多いためであると考察しています。また、アノテータ間の一致率も高く、データの品質の高さが裏付けられました。

議論の一つは、データセットの大部分が複数語から成る概念であるため、それが埋め込み方式での性能低下につながっている点です。このことから、複数語概念の処理方法が現在の技術の課題であることが示唆されます。また、人間上限（HUB）として示される関連性評価の限界値があるため、関連性モデルのパフォーマンスには改善の余地がありますが、0.9以上のスコアは難しいとされています。

次に読むべき論文を探す際には、以下のキーワードを使用することをお勧めします: “medical concept relatedness”, “EHR data retrieval”, “word embeddings in healthcare”, “multi-word expression processing in NLP”, “machine learning model benchmarking”. これらのキーワードを基に、関連する最新の研究や、特に複数語表現の処理に関する研究を探すのが良いでしょう。

引用情報

C. Schulz, J. Levy-Kramer, C. Van Assel et al., “Biomedical Concept Relatedness – A large EHR-based benchmark,” arXiv preprint arXiv:2211.12345v1, 2022.

監修者

阪上雅昭（SAKAGAMI Masa-aki）
京都大学　人間・環境学研究科　名誉教授

PCも苦手だった私が

“AIに詳しい人“
として一目置かれる存在に！

論文研究

医療概念の関連性と大規模EHRベンチマーク

さらに深い洞察を得る

AIBR プレミアム

“AIに詳しい人”として
一目置かれる存在に！

【実践型】
生成AI活用キャンプ

3ヶ月後には、
あなたも生成AIマスター！

引用情報

監修者

論文研究シリーズ

AI技術革新 - 人気記事

“AIに詳しい人“
として一目置かれる存在に！

あなたにオススメのカテゴリ

さらに深い洞察を得る

AIBR プレミアム

“AIに詳しい人”として一目置かれる存在に！

【実践型】
生成AI活用キャンプ

3ヶ月後には、あなたも生成AIマスター！

医療概念の関連性と大規模EHRベンチマーク

さらに深い洞察を得る

AIBR プレミアム

“AIに詳しい人”として一目置かれる存在に！

【実践型】 生成AI活用キャンプ

3ヶ月後には、あなたも生成AIマスター！

引用情報

監修者

論文研究シリーズ

関連記事

この記事をシェア

AI技術革新 - 人気記事

“AIに詳しい人“として一目置かれる存在に！

あなたにオススメのカテゴリ

さらに深い洞察を得る

AIBR プレミアム

“AIに詳しい人”として一目置かれる存在に！

【実践型】 生成AI活用キャンプ

3ヶ月後には、あなたも生成AIマスター！

AI Benchmark Researchをもっと見る

“AIに詳しい人”として
一目置かれる存在に！

【実践型】
生成AI活用キャンプ

3ヶ月後には、
あなたも生成AIマスター！

“AIに詳しい人“
として一目置かれる存在に！

【実践型】
生成AI活用キャンプ