靴大きい子は高学力?データ分析の怖い落とし穴 意思決定する人に知ってほしい「相関と因果」

✎ 1〜 ✎ 4 ✎ 5 ✎ 6 ✎ 最新
著者フォロー
ブックマーク

記事をマイページに保存
できます。
無料会員登録はこちら
はこちら

印刷ページの表示はログインが必要です。

無料会員登録はこちら

はこちら

縮小

では、いったいなぜ、因果関係がない2つの変数の間に相関関係が見られるのだろうか。こういった現象が観測される理由はいくつかある。

まず第1に、まったくの偶然という場合だ。

第2に、両方の変数に影響を与える変数が存在する場合。このような変数のことを交絡因子というが、交絡因子が存在するときには因果関係がなくても相関関係が見られることがある。

今回の小学生の靴のサイズと学力テストの結果の例はこれにあたると考えられ、交絡因子として学年が挙げられる。学年が高ければ、靴のサイズが大きくなる傾向があると考えられる。また、同じテストを受けた場合、学年が高い子のほうが点数は高くなることも考えられる。

このように学年が高い子は靴のサイズが大きく、テストの点数も高い。逆に学年が低い子は靴のサイズが小さく、テストの点数も低いというように、学年という変数が両方の変数に影響を与えることによって因果関係がないにも関わらず相関関係が見られることがある。変数間の関係を調べる際には交絡因子の存在をつねに注意しなければならない。

警察官の人数が多くなると犯罪が増える?

また因果関係はあるけれども、その方向を反対に見誤ってしまう場合もある。中室牧子氏と津川友介氏の共著『「原因と結果」の経済学―データから真実を見抜く思考法』では、この例として地域別の警察官の人数と犯罪の発生件数の関係が挙げられている。

横軸にその地域の警察官の人数、縦軸にその地域の犯罪の発生件数をとった散布図を作成したときに、先ほど同様に右上がりの関係が見られたとしよう。このとき、警察官の人数を多くすれば、犯罪の発生件数が増加するということがいえるだろうか。

これは因果の方向が逆と考えられる。つまり、犯罪の発生件数が多いから、その対策として警察官の人数を増やしたというわけである。このように因果の方向も変数間の関係を調べる際に注意しておかなければならない点の1つである。

さて、ここまでの相関関係があることがすなわち因果関係を示すわけではないということ、そして因果関係があるとしてもその方向が想定通りかはわからないという説明を通じて、データを見たまま鵜呑みにすることがいかに危険なことかわかっていただけたかと思う。

ではいったいどのような点に注意してデータを見ればよいのだろうか。

次ページ因果関係の有無を確かめる2つのポイント
関連記事
トピックボードAD
キャリア・教育の人気記事