2026年2月27日金曜日

第3講:【因果関係】「データに騙される人」を卒業する!相関関係との見分け方

イメージ画像 ㏚ 「データがこう言っているから、これが原因に違いない!」 会議で自信満々にプレゼンしたのに、鋭い上司から「それ、本当に因果関係あるの?」と突っ込まれて言葉に詰まったことはありませんか? 数字は嘘をつきませんが、数字の「解釈」は平気で嘘をつきます。 今回は、データ分析で最も陥りやすい罠、「相関関係」と「因果関係」の違いを世界一わかりやすく解説します。 1. 「アイスが売れると水難事故が増える」の謎 有名な例え話があります。 ある統計データを見ると、「アイスクリームの売上が上がると、水難事故の件数も増える」という強い関係が見つかりました。 これを真に受けて、**「水難事故を減らすために、アイスの販売を規制しよう!」**と考えたら……どう思いますか?「そんなバカな」と思いますよね。 ここで起きているのは以下の現象です。 相関関係: A(アイス)が増えると、B(水難事故)も増える(連動しているだけ)。 因果関係: Aが原因で、Bという結果が起きる(直接的なつながり)。 このケースでは、**「気温の上昇」**という共通の原因(第三の変数)が、アイスの売上と水難事故の両方を押し上げているだけ。アイスと事故の間に直接の因果関係はありません。 2. 仕事でやりがちな「偽の因果関係」 ビジネスの現場では、もっと巧妙にこの罠が仕掛けられています。 例①: 「残業が多いチームほど、売上が高い。だから売上を上げるために残業を増やそう!」 実際は: 「仕事量が多い(第三の変数)」から、結果として残業も売上も増えているだけ。 例②: 「この広告を出してから、会員数が増えた。この広告のおかげだ!」 実際は: 単に「ボーナス時期」だったから、消費意欲が上がっていただけかもしれない。 これを見誤ると、**「効果のない施策に予算を投じる」**という致命的な失敗につながります。 3. 【卒業検定】データに騙されないためのチェックリスト 分析結果を見たとき、反射的に信じる前に、次の3つの問いを自分に投げかけてください。 「逆」は成り立たないか?(逆の因果) Aが原因でBになったのか、それともBが原因でAになったのか?(例:顧客満足度が高いから売れるのか、売れているから満足度が高く見えるのか) 「第三の変数」は隠れていないか? AとBの両方に影響を与えている「真の原因(気温、景気、季節など)」はないか? ただの「偶然」ではないか? たまたま同時期に数値が動いただけではないか?(サンプル数は十分か?) 4. 本日のまとめ:数字の向こう側にある「ストーリー」を疑え データ分析の本質は、グラフを作ることではありません。「なぜその数字が動いたのか」という背景(メカニズム)を正しく推論することです。 相関関係は、単なる「ヒント」に過ぎない。 因果関係を証明するには、実験や深い洞察が必要。 「相関がある=因果がある」という思い込みを捨てるだけで、あなたの分析の鋭さは10倍に跳ね上がります。 次回の講義予告: データが不十分なとき、どうやって「正解」を推測すればいいのか? AI時代の必須教養、「ベイズ推定」を使った最強の推論術についてお話しします。 リブと一緒に、知の再起動を加速させましょう!