第6回　AIが変える政策評価　官民で目標を共有し成果を高める

公開日 : 2026.06.24

著者 :

松井研太（パートナー）

AIを活かすための4つの段階

BCGがこのプロジェクトを通じて得た最大の気付きは、意外なものだった。AI活用における最大の壁は、技術でも予算でもなく、「何を良い成果とするのか」という評価基準があいまいなことだったのである。

考えてみれば当然のことだ。AIは、与えられた評価基準を適用することはできても、何を「良い」とするか、基準そのものを決めることはできない。AIはあくまで採点者であり、何が良い答案かを決めるのは人間の役割だ。

明確な基準がないまま数千件のレビューシートをAIに読み込ませても、結果はぶれてしまう。BCGの実践から、EBPMにおいてAIを効果的に活用するためには、評価基準を明確化し、以下の4段階を順に積み上げていく必要があることが分かった（図表2）。

第1段階：評価尺度の言語化

出発点は、人間が「良い事業とはどんな事業か」を言葉にすることだ。これが、最も地道かつ最も見落とされやすいステップだ。

複数人で同じシートを評価してみると、結果がぶれる。あるいは、そもそも評価できないという事態が起きる。ベテランなら感覚的にわかることが、言葉にしてみると一致しない。なぜ判断がぶれたのかを言語化し、評価基準に落とし込み、再び評価する。このサイクルを繰り返すことで、「使える基準」が育っていく。

ここで一つの落とし穴がある。評価尺度を「論理が明快な事業を高く評価する」のように自然言語のまま書いてAIに渡しても、AIはその言葉を一貫して解釈できない。AIに対しては、「課題の原因が具体的に列挙されているか」「対策と原因が対応しているか」「成果目標が数値で設定されているか」といった、Yes/Noで答えられる問いに分解することが必要だ。この「問いの設計」こそが、AI評価の精度を左右する最大の変数なのである。

この第一段階を飛ばすと何が起きるか。2025年に米トランプ政権が立ち上げた政府効率化局（DOGE）の事例が参考になる。AIとデータを武器に少人数チームで連邦政府全体の歳出削減に挑む前例のない取組で、公表値で約2,140億ドル（約33兆円）を削減した。一方、「削ってはいけない機能は何か」の基準を事前に詰めきれなかったことで、事後的な調整が相次いだ。基準のあいまいさは後に大きなコストとなり、その重要性が改めて浮き彫りになった。評価尺度を言語化してからAIに渡すという第一段階を飛ばしてはいけない——この教訓は、規模や国を問わず共通する。

第2段階：AIによる大量スクリーニング

評価基準が固まったら、いよいよAIの出番だ。その基準をもとにAIが数千件のシートを高速で一次評価する。ここでは記載の充実度や論理の整合性を一定の基準で均一に確認できる。前年のレビューシートをそのままコピーして提出した事業も、この段階で検知しやすくなる。AIは疲れることもなく、基準を一貫して適用し続けられるため、100人のレビュアーを雇うよりも一つの評価基準を正確に作る方がずっと効率的だ。

第3段階：専門人材による文脈判断

ただし、AIの一次評価をそのまま最終判断に使うことはできない。AIが得意な定型チェック（記載の有無、数値の存在、論理構造の整合性）と、ベテランのレビュアーにしかわからない文脈の読み取り（事業の背景にある政策的意図、省庁間の調整経緯、現場の実態）を明確に仕分け、後者は人間が担う体制を設計する。人間がAIの意思決定に介在する「ヒューマン・イン・ザ・ループ（HITL）」の設計こそが、この段階の核心となる。

第4段階：本格的なAI評価の実装

AIと人間の分担が確立されて初めて、AIによる評価を組織の業務フローに本格的に実装できる。AIの評価結果を人間が検証し、プロンプトや基準をさらに改善していく継続的なサイクルを回すことで、評価の精度は磨かれていく。精度を高めようとするほど改善に要するコストは増大するが、それは避けて通れない投資だ。

AIを導入すれば人手が不要になるわけではない。むしろ、人間の役割は「評価すること」から「評価の仕組みを設計し、改善すること」へと移っていくのである。

企業は政府と自社の目標を共有する

EBPMの第2フェーズが進むことで、政府が何を目指し、何をもって「政策が成功した」とするかが、これまで以上に明確に示されるようになる。行政事業レビューシートや成果指標はすでに一般公開されており、政府の優先課題と評価軸は誰でも参照できる。

官民連携をテーマに政府と対話する企業が増えているが、補助金の活用や規制改革の要請、共同実証など、いずれの形でも、政府の目標と企業の成果指標がリンクされないまま制度だけが動いているケースは少なくない。「補助金を受け取っても効果が出なかった」「実証事業を行なったが実用化には至らなかった」。そうした「形だけ」の官民連携は、EBPMの普及によって成果が可視化される中で通用しにくくなるだろう。

EBPMの進展に伴い、企業が官民連携を目指すには、政策目標や評価軸を参照して自社の事業計画に反映することが求められる。補助や規制の恩恵を受ける側から、政府とともに社会的価値を創出する側へ。官民連携の第一歩は、政府と目標を共有し、その実現に向けた成果を明確に示すことである。

「自社にとって大切なこと」を問い直す

政府が直面したEBPMの課題は、企業にも示唆を与える。全社の目標が部門や個人の成果指標と連動していない。事業の目標があいまいなまま走っている。成果を客観的に測る指標が設定されていない。AIを導入して経営管理を高度化しようとした途端、自社のKPI体系自体があいまいだったという事実が浮かび上がる。

最もわかりやすいのは社内の事業評価や人材採用だ。件数が増えるほど評価軸がぶれ、担当者によって結果が変わる。事業評価では、足元の収益性か長期の戦略的意義のどちらを重視するのか。人材採用の場合だと、今期の即戦力か将来性のある人材のどちらを優先するのか。同じ「評価」でも問いが変われば基準も変わる。

まずは評価基準を言語化して自社の目標と成果をクリアにし、そのうえで全社から部門・個人の成果指標まで連動した状態をつくる。そうすることで、一つの目標に向けて一貫して改善し続ける組織の土台が整う。

AIを評価に使おうとして初めて、組織は「自分たちが何を大切にしているか」を問い直す。政策の良し悪しを測ろうとした政府が、「そもそも何のための政策か」を問い直したように、官民連携のKPIを合わせようとした企業が、「自社の目標とは何か」を問い直す。AI活用に向けて準備していただけのはずが、気づけば組織の根本的な問いに向き合っている。しかし、それこそがAI活用の本質なのである。

「政策と戦略」の記事一覧へ