User Intent to Use DeepSeek for Healthcare Purposes and their Trust in the Large Language Model: Multinational Survey Study(DeepSeekを医療目的で使う意図と大規模言語モデルへの信頼:多国間サーベイ研究)

田中専務

拓海さん、最近うちの若手が『DeepSeekが医療でも使える』って騒いでましてね。正直、何がそんなにすごいのかがわからないのですが、要するにうちの現場に役立ちますか?

AIメンター拓海

素晴らしい着眼点ですね!DeepSeekは大規模言語モデル(Large Language Model, LLM)を用いた対話型サービスで、医療情報の探索や患者向けの初期案内などに使える可能性がありますよ。まずは結論だけを言うと、導入の鍵は「使いやすさ」「有用性」「信頼」の三つです。

田中専務

三つですか。で、その信頼っていうのはどうやって測るんです?機械にお任せして大丈夫かどうかの判断材料が欲しいんです。

AIメンター拓海

いい質問ですね!研究ではアンケートでユーザーの「信頼(Trust)」を直接聞き、さらに「使いやすさ(Ease of Use)」や「有用性(Perceived Usefulness)」が信頼にどう影響するかを構造方程式モデルで分析していますよ。要点は三つ、信頼は仲介役になること、使いやすさは信頼を通して利用意図に影響すること、そしてリスク認知が直接的に利用意図を下げることです。

田中専務

具体的に、うちが投資するかどうかの判断で重視する数値とか指標はありますか?たとえばROI的にどうなるか見当がつきにくくて。

AIメンター拓海

素晴らしい着眼点ですね!本研究は主に心理的要因と利用意図を扱っており、ROIそのものは扱っていません。ただ、実務で使う際は利用意図(Intent to Use)と実利用率を掛け合わせて期待される効果を現場KPIに落とし込めます。まずは小さなパイロットで「使いやすさ」と「信頼」を向上させ、利用率の伸びを測るのが安全なやり方ですよ。

田中専務

なるほど、まずはテスト導入ですね。で、リスク認知というのは具体的にどんな懸念ですか?個人情報の漏洩とか間違った案内をすることですか?

AIメンター拓海

その通りです!リスク認知(Risk Perception)はプライバシーや誤情報、診断誤りなどを含みます。研究ではリスク認知が高いと利用意図が低下するという結果が出ていますから、現場導入ではデータ管理と透明性の担保、そして誤り時のエスカレーション設計が重要になります。要点は三つ、データ保護、説明可能性、ヒューマンインザループの設計です。

田中専務

これって要するに、使いやすくして信頼を得れば現場で使ってもらえる可能性が高くて、リスクを放置すると導入が進まないということですか?

AIメンター拓海

その理解で正しいですよ!素晴らしい着眼点ですね!まとめると、1) 使いやすさ(Ease of Use)を高める、2) 有用性(Perceived Usefulness)を現場KPIに直結させる、3) 信頼(Trust)を高めるためにリスク管理と説明可能性を整える、の三本柱で進めれば導入成功の確度が上がります。一緒にロードマップを作れば必ずできますよ。

田中専務

分かりました、まずは小さく試して効果を見て、問題がなければ拡大する。これなら現実的だと思います。では最後に、私の言葉で要点を言うと、使いやすさと有用性で信頼を作って、リスク対策を固めれば医療向けのDeepSeek導入は実行可能、ということでよろしいですか。

AIメンター拓海

その表現で完璧ですよ。大丈夫、一緒にやれば必ずできますよ。

1.概要と位置づけ

結論を先に述べる。本研究は、LLM(Large Language Model、大規模言語モデル)ベースのプラットフォームであるDeepSeekに対する医療用途での採用意図を、ユーザーの認知と信頼の観点から定量的に明らかにした点で大きく貢献している。具体的には、使いやすさ(Ease of Use)、有用性(Perceived Usefulness)、信頼(Trust)、リスク認知(Risk Perception)という四つの心理的要因がどのように相互作用し、最終的に使用意図(Intent to Use)を形成するかを構造方程式モデリングで実証している。医療現場というリスクに敏感な文脈で、単なる技術性能ではなく利用者側の心理が導入成否を左右することを示した点が重要である。実務的には、技術提供側がユーザーの信頼獲得に注力する必要があることを示唆している。

本研究は多国間サンプル(インド、英国、米国、計556名)を用いることで、単一国のバイアスを抑えた比較的堅牢なエビデンスを提示する。調査手法は既存のテクノロジー受容モデル(Technology Acceptance Model, TAM)に基づく尺度を適用し、それをDeepSeekという特定のLLMアプリケーションに適合させた点が特徴である。TAMの枠組みを医療LLMに適用することで、技術設計と人間工学(Human Factors)の接点が浮かび上がる。政策決定や製品設計の場面で示唆を与える研究である。

産業応用の観点からは、特に中小規模の医療サービスや医療相談チャネルのデジタル化を検討する経営層にとって有用である。なぜなら、技術的な完成度だけでなく、現場の受け入れ性が高ければ短期的に運用効果が期待でき、逆に信頼を欠けば導入失敗のリスクが高まるという実務的な判断軸を提供するからである。要は、投資判断の際に『技術評価』だけでなく『信頼評価』を定量的に見積もるべきだということである。

以上を踏まえると、本研究の位置づけは、LLMの医療応用に関する「人間中心の受容研究」として評価できる。技術面の性能議論と並行して、ユーザー心理とリスク対応が製品設計と導入戦略の核心であることを示している点が新規性である。経営判断としては、導入前評価と段階的実装が推奨される。

2.先行研究との差別化ポイント

本研究の差別化点は三つある。第一は、DeepSeekのような特定のLLMプラットフォームに焦点を当て、医療用途における受容メカニズムを経験的に検証した点である。多くの先行研究は汎用的なLLMの性能や倫理的議論に偏るが、本研究はユーザー心理を中心に据えている。第二に、多国間サンプルを用いることで地域差の影響を排し、より一般化可能な結論を導いている点である。第三に、構造方程式モデリング(Structural Equation Modeling, SEM)を用いて直接効果と媒介効果を同時に検証し、信頼が媒介変数として働くことを示した点である。

先行研究では、ChatGPTなどの汎用LLMに関するユーザー調査が多数あるが、医療分野の具体的アプリケーションを対象にした包括的な心理モデルの実証は限られていた。本研究はTAMの主要変数を保持しつつ、リスク認知の影響や非線形関係の可能性まで考慮して分析を行っているため、医療現場での導入設計に即した知見を提供する。設計者はこのモデルを設計要件に翻訳できる。

また、研究方法論の面でも差別化されている。定量調査とSEMの組み合わせにより、単なる相関ではなく因果関係の仮説検証に近いエビデンスが得られている。これにより、使いやすさや有用性の改善が信頼にどの程度寄与するかを数値的に見積もることが可能だ。経営判断に必要な定量的根拠を提供する点で有益である。

総じて、技術性能の議論だけでなく、受容性とリスク対応を一体で扱った点が本研究の強みであり、先行研究との差別化につながっている。実務的には、製品ロードマップやパイロット設計の根拠として活用できる。

3.中核となる技術的要素

本研究自体は新たなアルゴリズムを提案する論文ではないが、評価対象であるDeepSeekの理解のために押さえるべき技術要素がある。まずLLM(Large Language Model、大規模言語モデル)そのものは膨大なテキストから言語パターンを学習し、入力に対して自然言語で応答を生成する技術である。ビジネス比喩で言えば、LLMは巨大な参考書を参照して適切な回答の候補を提示する「知識の検索と翻訳」の仕組みである。DeepSeekはこの仕組みを医療情報探索に最適化したインターフェースである。

次に重要なのはユーザーインターフェースとフィードバックの設計である。使いやすさ(Ease of Use)は操作性やナビゲーションの直感性を指し、現場導入で最初に評価される項目である。これはビジネスでいう営業ツールの操作性に相当し、現場での摩擦が少ないほど利用意図は高まる。研究はこの経路が信頼(Trust)を通じて最終的な利用意図に影響することを示した。

さらに、説明可能性(Explainability)とエラー時の処理設計が技術的要素として挙げられる。医療用途では回答の根拠を示したり、不確実性を明示したりする機能が不可欠である。これは誤答が出たときの対応プロセスを明確にすることでリスク認知を下げ、信頼を高める設計である。技術者はこの点を優先して実装する必要がある。

最後にデータガバナンスである。医療データを扱う場合、プライバシー保護とアクセス制御が法令順守だけでなく利用者の信頼を保つ要因になる。技術的にはログ管理や匿名化、セキュアなAPI設計が中心となる。結論として、DeepSeekの医療利用にはLLMの生成力と同等にインターフェース、説明性、データ管理の三点が重要である。

4.有効性の検証方法と成果

研究は横断的サーベイ(cross-sectional survey)を556名を対象に実施し、各国の参加者を比較可能な形で組み入れた。尺度は既存のテクノロジー受容研究から採用された標準的質問項目を用い、使いやすさ、 perceived usefulness(有用性)、trust(信頼)、risk perception(リスク認知)、intent to use(利用意図)を測った。分析には構造方程式モデリング(SEM)を用いて、直接効果と媒介効果を同時に評価している。

主な成果は次の通りである。使いやすさと有用性は信頼を強く高め、信頼は利用意図に対して最も大きな正の影響を持つという点だ。さらにリスク認知は利用意図を直接抑制する効果が確認された。これにより、設計改善によって信頼を高めれば利用意図を間接的に押し上げられる一方、リスクが高いと感じさせる要素を放置しては導入が進まないことが示された。

また研究は媒介効果の大きさを数値として報告しており、例えば使いやすさ→信頼→利用意図の経路での標準化係数が有意であることを示している。これにより、UI改善の投入効果を定量的に見積もることが可能になる。経営的には、どの改善が投資対効果に寄与するかの優先順位付けが行える。

検証の限界としては、自己申告による意図測定であり実際の行動を直接観察していない点、横断調査のため因果推定が限定的である点が挙げられる。それでも多国間で一貫した傾向が得られたことは現場導入の検討に有用な一次情報と言える。

5.研究を巡る議論と課題

まず議論となるのは「意図」と「行動」の乖離である。利用意図(Intent to Use)は行動の予測子として有益だが、実際の導入や日々の利用率は組織文化や運用体制、法的制約に左右される。従って経営判断では、調査結果を参考にしつつパイロット運用で実際の行動を検証する必要がある。研究はその判断材料を提供するが、最終的な投資判断は実地データで補強すべきである。

次にリスク認知の扱いである。リスクは主観的であり、情報提供や仕様の透明化で大きく変わり得る。これは技術的な改善だけでなくコミュニケーション戦略や教育施策と組み合わせる必要を意味する。エンドユーザーが安心して使えるように、説明可能なUIや誤り時の明確な対応フローを整えることが求められる。

第三にサンプルの代表性と文化差の課題である。多国間調査は広い視点を与えるが、各国の医療制度や規制、リスク感覚の違いを完全に統制するのは難しい。したがって導入時には自社や地域のコンテクストに合わせた再評価が必要である。グローバル導入を目指すならローカライズ戦略を明確にすべきである。

最後に倫理と規制の問題が残る。医療情報を扱うAIには厳しい説明責任と監査可能性が求められるため、製品設計段階から法務・倫理のチェックを組み込むことが必須である。これを怠ると短期的には導入を加速できても、長期的な信頼を失うリスクが高い。

6.今後の調査・学習の方向性

今後の研究課題は四点ある。第一に、意図と実際の利用行動を結びつける縦断研究(longitudinal study)や実地実験を通じて因果を明確にすることである。企業としては段階的にA/Bテストやパイロットを実施し、実行データを蓄積することが望ましい。第二に、説明可能性(Explainability)や不確実性の提示方法が利用意図と信頼に与える影響を比較検証することである。

第三に、リスク認知を下げるための具体的介入策の評価が必要である。例えばプライバシー保証の可視化や誤情報時の人間介入プロセス提示が利用意図をどの程度改善するかを実験的に検証すべきである。第四に、多様な医療現場(プライマリケア、遠隔診療、患者支援チャネル等)ごとの最適設計を探ることが重要である。各業務フローに最適化されたUIやガバナンスが異なるためである。

経営層への示唆としては、まず小さな投資で効果を検証し、得られたエビデンスを基に段階的に拡大することが推奨される。技術導入は一度に全てを変えるべきではなく、信頼を積み上げる工程を設計することが成功の鍵である。

会議で使えるフレーズ集

「この調査は、使いやすさと有用性が信頼を介して利用意図を高めることを示していますから、まずはUI改善で信頼を作りにいきましょう。」

「リスク認知が高いと導入が進みません。プライバシーと説明性の担保を設計要件に入れてください。」

「まずはパイロット運用で実データを取り、ROIと実利用率を掛け合わせた期待効果を見積もりましょう。」

検索に使える英語キーワード:DeepSeek, Large Language Model, LLM, trust in AI, technology acceptance, healthcare AI adoption, user intent, risk perception.

A. Choudhury, Y. Shahsavar, H. Shamszare, “User Intent to Use DeepSeek for Healthcare Purposes and their Trust in the Large Language Model: Multinational Survey Study,” arXiv preprint arXiv:2502.17487v2, 2025.

AIBRプレミアム

関連する記事

AI Business Reviewをもっと見る

今すぐ購読し、続きを読んで、すべてのアーカイブにアクセスしましょう。

続きを読む