MedHallBench: 医療用大規模言語モデルの幻覚評価ベンチマーク(MedHallBench: A New Benchmark for Assessing Hallucination in Medical Large Language Models)
田中専務拓海先生、最近また「医療AIの幻覚(hallucination)」って話を聞きましてな。現場で誤った診断や治療方針を出す可能性があると聞くと、うちの現場にも影響がありそうで心配なのです。AIメンター拓海素晴らしい着眼点ですね!大丈夫、今回は医療用大規模言語モデル(Medical