SDG13(気候変動対策)に関する研究出版物抽出手法の比較 — A comparison of different methods of identifying publications related to the United Nations Sustainable Development Goals: Case Study of SDG 13 – Climate Action

田中専務

拓海先生、お時間をいただきありがとうございます。部下から「SDGとか論文検索で評価を出せ」と言われまして、正直どこから手を付ければいいか分かりません。要点だけ教えていただけますか。

AIメンター拓海

素晴らしい着眼点ですね!まず結論だけ。論文は「同じ目的でも検索手法によって拾える論文が大きく異なる」ことを示しています。したがって評価や戦略は使う検索手法を定義しないと比較不可能になりますよ。

田中専務

それは厄介ですね。つまり数字が違えば「効率が良い」って判断も変わるわけですか。現場に何を指示すればよいか、投資の判断基準がぶれそうで怖いのです。

AIメンター拓海

大丈夫、一緒に整理しましょう。要点は三つです。1つめ、検索語(search strings)と専門家の関与が結果を左右する。2つめ、データベースのカバレッジが差を生む。3つめ、後処理の手法で重複や抜けが変わるのです。

田中専務

検索語って、要するに単語の選び方次第で結果が変わるということですか。例えば「再生可能エネルギー」を入れるかどうかで数が変わるといった話ですか。

AIメンター拓海

その通りです。素晴らしい着眼点ですね!たとえばあるデータ提供者はSDG13(気候変動対策)に関連する検索語に”renewable energy”を単独では入れないと決めています。これはSDG7(Affordable and clean energy)との重複を避けるためですから、方針によって対象集合が変わるのです。

田中専務

なるほど。じゃあどの方法を採るかで外部報告や評価が変わるわけですね。実務としてはどこをチェックすればいいでしょうか。

AIメンター拓海

チェックポイントは三つです。まず検索語の設計方針、次に使っている文献データベースの範囲、最後に結果の拡張やフィルタリングの方法です。これらを文書化すれば再現性と説明可能性が担保できますよ。

田中専務

説明可能性というのは、株主や関係者に説明するためという理解で合っていますか。数字が違うと怒られかねませんから。

AIメンター拓海

その通りですよ。説明可能性はガバナンスの要です。検索の方針や除外ルールを定義書に残し、どの手法で何が拾えたかを比較するプロセスを作れば、説明は格段に楽になります。

田中専務

実務的な緊急対応を教えてください。すぐに部下に指示するなら何を最優先にしますか。

AIメンター拓海

大丈夫、一緒にやれば必ずできますよ。まずは三つの文書化を指示してください。検索語設計方針、使用データベース一覧、重複処理と拡張ルールです。これだけで評価の信頼性が大きく上がります。

田中専務

これって要するに、同じSDGの評価でも”誰が・どうやって”抽出したかを明確にしないと比較や報告に意味がない、ということですか。

AIメンター拓海

まさにそのとおりです。素晴らしい着眼点ですね!形式的な定義がなければ、数字は比較できません。ですから方針の透明化が最優先です。

田中専務

分かりました。最後に私の理解をまとめさせてください。若い社員に分かりやすく説明できるようにまとめますね。

AIメンター拓海

素晴らしい着眼点ですね!ぜひ最後に田中専務の言葉で確認してください。一緒にチェックしましょう。

田中専務

要するに、SDG13の研究を数える際は、検索語とデータベース、後処理のルールを明確にして比較可能にする。そうすれば我々も社内外に堂々と説明できる、ということですね。

1.概要と位置づけ

結論を先に言うと、この研究は「同じSDGを扱っても、用いる検索の設計とデータベースによって抽出される論文集合が大きく異なる」ことを示した点で評価に直結する知見を与えた。持続可能な開発目標(Sustainable Development Goals: SDGs、持続可能な開発目標)の一つであるSDG 13(SDG13、気候変動対策)に関して、四つの異なる方法論が取り出す論文群を比較し、重複や過不足の実態を明らかにしている。

なぜ重要かを説明する。経営や研究評価の現場では「何本の論文があるか」が指標となるが、その数自体が方法論依存であるなら、評価の公平性や比較可能性が損なわれる。研究機関や大学、企業のCSR(企業の社会的責任)やR&D戦略にとって、数の信頼性は投資判断や方針決定に直結する。

この論文は具体的に四つの手法を比較することで、どの要因が差を生むかを分解した。比較対象となったのは、検索語の設計、専門家の関与、データベースのカバレッジ、そして結果の拡張やフィルタリングの違いである。特にデータベースのカバレッジ差は、単純な件数差以上に話を複雑にする。

経営層が押さえるべきは、評価数字を受け取ったときにその「前提」を必ず確認することだ。どの検索語を使い、どのデータベースを参照し、どのような後処理で最終リストが作られたのかを示すドキュメントがない限り、比較や意思決定に使うのは危険である。

この段階での示唆は明快である。指標に基づく内外の説明責任を果たすためには、検索・抽出のプロトコルを標準化し、文書化することが不可欠である。

2.先行研究との差別化ポイント

先行研究の多くは単一の手法やデータベースに依拠してSDG関連文献を集計している。だが本研究は四つの独立した方法を並列で比較し、それぞれの検索ストリング(search strings、検索語列)の中身を細かく分類して一般語、政策関連語、技術語に整理している点が新しい。単に件数を示すのではなく、入力(検索語)と出力(論文集合)の関係を明示的に分析した。

特に注目すべきは専門家の関与の影響である。専門家がどの語を重視するかにより、政策寄りの文献が増えるのか、技術寄りの文献が増えるのかが変わってくる。これは単純な自動抽出と人の判断を組み合わせた際のバイアス源を示すもので、実務上の意義が大きい。

また本研究はデータベースのカバレッジ差にも着目した。あるデータベースは学術誌の網羅が広く、別のものは特定分野に強い。結果としてある方法では大量の論文が出る一方で別の方法では小さくまとまるケースが確認された。この点は先行研究が見落としがちだった。

さらに、研究は結果の可視化にVOSviewer(VOSviewer、ネットワーク可視化ツール)を用い、各方法がどのトピックを強く拾うかを視覚的に示している。可視化を通じて、方法間の「質的」違いが直観的に理解できる形で示された点は差別化の一つである。

総じて、先行研究との違いは「定量的な件数比較」だけでなく「方法設計とアウトプットの構造的な対応関係」を示した点にある。これが経営判断に必要な説明材料を提供する。

3.中核となる技術的要素

まず用語の扱いだ。検索ストリング(search strings、検索語列)は単語の組合せであり、どの語を含めるか否かが結果を左右する。専門用語は英語表記で作成されることが多く、語の同義語や変形をどの程度含めるかが重要である。設計段階での方針次第で対象集合が偏る。

次にデータベースである。ここで言う文献データベース(bibliographic database、文献索引データベース)は各社が持つ収録誌リストの集合体で、収録対象や採録ポリシーが異なる。カバレッジの広さや学術分野の偏りが、件数差やトピックの偏りを生む。

さらに検索結果の拡張/フィルタリングだ。ある方法はキーワードに基づく自動拡張を行い、関連性の高い論文を拾う。一方で別の方法は厳格なキーワード一致のみを採る。重複除去や文献のマージ方法も結果に影響するため、処理フローの細部が重要である。

加えて専門家の関与はバイアスを生む可能性があるが、同時に文脈を取りこぼさない利点がある。機械的な抽出と専門家判断のバランスをどう取るかが設計上の核心である。ここでのテクニックは単なるツール選定だけでなく、運用ルールの設計に及ぶ。

経営視点では、これらの技術的要素を「標準運用手順」として落とし込むことが肝要である。手順が明確であれば、同じ方法を繰り返し使えるため評価の一貫性が担保される。

4.有効性の検証方法と成果

本研究では四つの手法による出力集合の重複率と余剰(surplus)の定量比較を行っている。重複率とは複数手法で共通に拾われた論文の割合を指し、余剰は一手法が他手法に比べて追加で拾う論文数を示す。これらの指標によって方法ごとの特徴が明らかになった。

結果として、手法間の重複は意外に小さく、各手法がかなり異なる集合を返すことが示された。特に、より広範に収録するデータベースを使う方法は総数で大きな余剰を示す一方、専門家主導の方法は特定の政策寄りトピックを深く拾う傾向が見られた。

可視化結果は定量指標を補い、どの手法がどの研究トピックを強調するかを示した。これにより単に件数を比較するだけでなく、トピック分布の観点からも手法の違いが把握できる。実務では件数と質の両面を確認するべきである。

検証の限界も明示されている。どの手法にも個別の設計判断やデータベース由来の偏りが残るため、絶対的な正解集合を得ることは困難である。したがって比較研究は方法論の違いを露呈させる道具であり、最終的な「評価方針」は組織ごとに定める必要がある。

結局のところ、有効性の評価は「透明性」と「再現性」に尽きる。どの手法を使ったかを明示すれば、結果の差は説明可能なものになる。

5.研究を巡る議論と課題

議論の中心は二点に集約される。第一に、検索語設計や専門家介入が与えるバイアスの扱いである。どう定義するかで組織評価が左右される以上、外部に対する説明責任が生じる。第二に、データベースのカバレッジ差の是正方法である。単一の基準に依存すると偏った評価を招く。

技術的課題としては、同義語処理や言語差異の扱いがある。英語表記主体の検索は英語以外の研究を取りこぼすリスクがあり、国際比較を行う際には注意が必要である。さらに引用基盤やジャーナルの質指標も考慮すべきだが、これをどう統合するかは未解決である。

運用面では、結果の再現性を担保するためのドキュメント化と、レビューのプロセス設計が必要である。抽出ルールを定期的に見直すこと、外部レビューを受けることも検討すべきである。これらはコストを伴うが、説明責任を果たすための投資と考えるべきだ。

最後に、研究は「どの方法が正しいか」を決めるのではなく「違いを示す」ことに価値があると結んでいる。実務者はその違いを理解し、自組織に適したプロトコルを選び取る責任がある。

結論的に、評価の信頼性は方法論の透明化と継続的な運用改善によって高められるという点が最大の教訓である。

6.今後の調査・学習の方向性

今後の研究課題としては三つある。第一に、複数データベースを統合したハイブリッドな抽出枠組みの開発である。これは単独データベースの偏りを緩和する効果が期待できる。第二に、自動化と専門家判断の最適なハイブリッド化である。どの段階で人を入れるかのコスト効果分析が必要だ。

第三に、国際比較を可能にする多言語対応の検索語辞書の整備である。英語以外の文献を取り込めれば、SDG評価の公平性が高まる。教育面では、経営層向けの評価プロトコル理解を促す教材整備が求められる。

実務者への提言としては、まず現状の検索・抽出プロセスを可視化し、短期的にはドキュメント化を行うことだ。中長期的にはハイブリッド手法や多言語化の投資を検討し、評価の一貫性と公平性を高めるべきである。

検索に使える英語キーワード(参考): “climate change”, “climate action”, “adaptation”, “mitigation”, “policy”, “resilience”, “vulnerability”, “greenhouse gas”, “carbon emissions”, “climate finance”

会議で使えるフレーズ集

「この評価はどの検索ストリングを基に算出したのか、明文化されていますか?」

「どのデータベースを参照しており、そのカバレッジに偏りはありませんか?」

「専門家判断による補正は何を基準に行いましたか。基準書はありますか?」


引用: P. J. Purnell, “A comparison of different methods of identifying publications related to the United Nations Sustainable Development Goals: Case Study of SDG 13 – Climate Action,” arXiv preprint arXiv:2201.02006v4, 2022.

AIBRプレミアム

関連する記事

AI Business Reviewをもっと見る

今すぐ購読し、続きを読んで、すべてのアーカイブにアクセスしましょう。

続きを読む