第6回 AIが変える政策評価 官民で目標を共有し成果を高める

公開日 : 2026.06.24

選挙のたびに、私たちは「あの政策は正しかったのか」という問いに向き合う。給付金は経済を立て直したのか。教育改革は子どもたちの学力を上げたのか。医療費の抑制策は、医療の質を損なったのか、それとも無駄を省いただけなのか――こうした問いに対する明確な答えが出ないまま次の選挙を迎え、新たな政策が打ち出される。

そもそも、「良い政策」を定義すること自体が根本的に難しい。思想や利害の違いによって何が望ましいかは人それぞれであり、最終的に多数決によって方向性を決めるしかない。しかしそれだけでは、政策が大きく揺れ動いてしまう。こうした状況の中、近年注目されているのが、「EBPM=エビデンス(根拠)に基づく政策立案」である。連載第6回では、EBPMの仕組みや課題、AI活用による変化について解説し、そこから見えてくる企業経営への示唆を考察する。

EBPMの仕組みと、政策の「良さ」を測る難しさ

EBPMとは、政策効果を定量的に測定し、エビデンスに基づいて政策を評価するアプローチである。誰がどれだけ恩恵を受けたのかをデータで把握し、そこで得た学びを踏まえて、より成功確率の高い政策を選んでいこうという発想だ。

EBPMを巡るこれまでの「第1フェーズ」は、仕組みと透明性の確立だったと言える。米国ではオバマ政権期にこの考え方が強化され、政権交代後のトランプ政権下でも取組が継続している。日本でも2013年の閣議決定で、行政事業レビューの実施によって「事業のより効果的かつ効率的な実施並びに国の行政に関する国民への説明責任及び透明性の確保を図り、もって国民に信頼される質の高い行政の実現を図るものとする」として、エビデンスに基づく政策評価の枠組みが整備された。それ以降、行政事業レビューガイドブックや評価プロセスの一般公開を通じて土台を積み上げてきた。2024年の骨太方針では、重要政策についてエビデンスに基づくロジックモデルの検証やKPI(重要業績評価指標)の進捗確認を行い、その成果を政策立案に反映することが強く謳われた。

EBPMの基本的な構造は、次のサイクルだ。①政策立案時にKPIを定め、②実施後はそのKPIを定量的に計測し、③計測結果と政策の「良さ」の判定を知識として積み重ね、次の立案に活かす。シンプルに聞こえるが、実際には各ステップに固有の難しさが伴う。

まず②の計測が難しい。雇用拡大、学力向上、疫病減少など、政策の成果を大規模に測定するには膨大な工数がかかる。さらに、根拠として認められる精度で効果を測るには、政策を適用した対象と適用しなかった対象を比較するなど、統計を厳密に設計することが必要だが、それを現実の政策運営に組み込むことは容易ではない。

③の見直しも難しい。精緻な評価結果が得られたとしても、それだけを根拠に政策を転換する意思決定に踏み込むことは、政治的にも組織的にも、困難な場面が多い。

そして最大のハードルは、対象となる政策の規模にある。政府が毎年扱う予算事業は数千件に上る。担当者が変われば評価軸はぶれ、省庁ごとに習熟度も異なる中で、均一な基準で全事業を評価することは人手では限界がある。評価できたとしても、その結果を政策ごとに整理し、後続の立案に転用できる仕組みと専門人材が、現状では十分に整っていない。

仕組みは整ったが、回しきれていない。それが第1フェーズの現状だ。

生成AIで量の壁を突破する

こうした中、生成AIという新しいツールが登場した。毎年数千件に上る行政事業レビューシートについて、政策の狙いや成果目標が国民にわかりやすく伝わる形で記載されているかを、大規模かつ均一な基準で確認する。かつては人手では到底回らなかったこの作業が、現実のものになってきた。

内閣官房は「行革AI活用プロジェクト『AI(アイ)プロ』」と銘打って、約5,900枚のレビューシートを対象にAIで確認を行い、その結果を一般公開している(図表1)。BCGも、内閣官房とともにこのプロジェクトに携わってきた。

政府が実施した「レビューシートのデータ分析およびAIの利活用等に関する調査研究」の流れを示した図表。AIが効率的かつ人間同様の精度でレビューできる項目を絞り込んでいる

これは、EBPMの「第2フェーズ」の幕開けだ。仕組みをつくり、透明性の確立を進めてきた第1フェーズに対し、第2フェーズでは、AIを活用してその仕組みを実際に回し、評価の質と量を飛躍的に高めることを目指す。

BCGが実践を通じて得た、AIを活かすために必要な4つの段階とは?

1 / 2 12 最後 »
この記事をシェア
おすすめ記事

あわせてよみたい