企業はどの生成AIを使うべきか(前編)  事業に適したモデル選びが重要

企業が生成AIの導入を本格化させる中、どのモデルを選択すべきかが重要な問いとなっている。適切なモデルを選ぶには、コスト、応答速度、ライセンス条件、アーキテクチャ、性能など、多くの要素を総合的に検討する必要がある。だが実際には、性能が圧倒的に重視されがちだ。多くの組織は、ベンチマークに対してどれだけ高いスコアを示すか、という一点に矮小化して性能を判断しており、多くの経営層はこうした判断を技術部門に全面的に委ねている。これらはいずれも適切な対応とは言えない。

性能と同様に重要なのが、AIのアウトプットの方向性を形作る「視点」だ。各モデルの視点は、システムの開発や導入に関わった人々の影響を受けている。学習データの作成方法や、システム設計におけるアーキテクチャの選択などがその一例だ。視点そのものに良し悪しはなく、埋め込まれた世界観を反映しているにすぎない。しかし、視点が異なれば、アウトプットも異なる。ここでは、実際に同一の四半期報告書やデータに対して、モデルごとに異なる結果が出た事例を紹介する。

モデルの精度だけでなく、視点の多様性も重要

市場には、独自開発モデルからオープンソースまで、何百万もの生成AIモデルが存在する。企業が複数のモデルを評価する際には、どのような視点が自社の従業員の業務を方向づけるのか、意識的に見極める必要がある。

AIエージェントの台頭は、モデルを精査する重要性をさらに高めている。今後、企業はAIを汎用的な思考パートナーとして、あるいは企業の代理として自律的に行動するエージェント型システムとして活用していくだろう。だからこそ、企業は各モデルの視点が意思決定や行動にどのような影響を及ぼすのか、十分に理解しておくことが不可欠だ。

企業が特定のモデルを選択することは、ユーザーが受け取るアウトプットを方向づける「レンズ」を選ぶことにほかならない。そのレンズは、ユーザーが目の前のビジネス課題をどのように分析し、何を優先し、どんな行動に移すのかという判断にまで影響を及ぼす。

視点の違いはアウトプットに大きな差を生み出す

視点の違いがいかに大きな差を生み出すかを、次の2つの事例から検討する。

まず、あるテクノロジー企業の決算報告書について、2つの生成AIモデルに要約を依頼した。プロンプトは次の通りである。「この決算報告書において、最も重要でありながら見落とされがちな項目を一つ挙げよ。その項目を、3つの箇条書きで要約せよ」。

以下がそれに対するモデルA・Bの回答である。

モデルA:設備投資の急増

このテクノロジー企業は2025年に約〇十億ドルの設備投資を計画しており、これは過去数年と比べて大幅な増加である。本決算報告は、AIインフラの強化、クラウド事業の拡大、データセンターの増設に向けた強いコミットメントを示している。

一方、この積極的な投資は短期的なフリーキャッシュフローに圧力をかける可能性があり、AIおよびクラウド分野における競争の激化を示唆している。とりわけ、クラウドインフラやAI関連サービスにおいて、この投資がどのように収益成長と結びつくのかを、投資家は注視する必要がある。

モデルB:クラウド部門の営業利益の増加

この企業のクラウド部門の営業利益は大幅に改善し、2024年第4四半期には〇十億ドルに達した。これは、2023年第4四半期の〇百万ドルから大きく伸びた水準である。

この好調な業績は、クラウド部門のプラットフォームが力強く成長し、特に主力製品やAIインフラ、生成AIソリューションの拡大によってけん引されたものだ。営業利益の増加はクラウド部門における収益性と効率性の向上を示している。これは市場アナリストの予想を上回る結果で、事業が今後も前向きな軌道をたどる可能性を示唆している。

いずれのアウトプットも事実関係としては正確だが、データの解釈や何を最重要視するかの視点が異なる。Aはコスト圧力やリスクに焦点を当て、Bは収益成長に焦点を当てている。こうした要約を基に投資戦略を検討するアナリストは、どのアウトプットを参照するかによって結論の出し方が異なり、最終的な投資判断も変わり得る。

次に、あるコモディティーの半年後の価格を予測するよう、3つの生成AIモデルに依頼した。その結果、各モデルはそれぞれ異なる予測値を示し、資本配分に関してアナリストが導き得る結論も大きく変化する可能性があると分かった(図表1)。こうした事例から、各モデルが経済指標や地政学的リスク、その他の要因をそれぞれ異なる重みづけで評価していることが明らかになった。しかし、こうした違いは知識が十分ではないユーザーには容易に見抜けない。

あるコモディティーの半年後の価格予測を3つのAIモデルに依頼し、その結果を示した図表。モデルごとに予測結果にばらつきがある

これらの事例から、汎用的なベンチマークだけでは生成AIモデルの性能を十分に評価できないことは明らかだ。同時に、企業は各モデルの視点を選定基準の中核として位置付けるべきであることも分かる。

完全に中立的なモデルが望ましいものの、現実的にはそうしたモデルの構築は不可能だ。ファインチューニング(追加学習)やプロンプトの設計によってアウトプットに一定の影響を与えることはできるが、モデルに組み込まれた世界観を完全に消し去ることはできない。さらに、視点を過度に中和しようとすると、モデルの安全性を低下させるなど、別の問題を招く恐れもある。

そのため、企業のリーダーは各モデルが持つ視点を正しく理解し、その上で特定のユースケースに最も適したモデルを意図的に選択する方向へと発想を転換すべきである。たとえば、ナレッジワーカーの思考パートナーとして既存の見解にあえて異議を唱えることで議論したり新たな着想を引き出したりすることが目的であれば、対立的な視点を持つモデルが有効かもしれない。一方、新たな企業方針の影響を評価するようなケースでは、複数の文化的・社会的視点を反映するシステムのほうが適している可能性がある。その場合には、複数のモデルを組み合わせ、それぞれのアウトプットをユーザーに提示するアプローチが有効だろう。

原典: Understanding Every Model Has a Point of View(2026年1月)

記事一覧へ