靴大きい子は高学力?データ分析の怖い落とし穴 意思決定する人に知ってほしい「相関と因果」

✎ 1〜 ✎ 4 ✎ 5 ✎ 6 ✎ 最新
拡大
縮小

例えば、ある小学校の児童をランダムに20人選び、何らかの学力テストを受けてもらったとしよう。この散布図の縦軸がそのテストの得点で横軸がその小学生の靴のサイズだとしても同じように考えることができるだろうか。つまり、小学生は足のサイズを大きくすれば、勉強ができるようになると考えるだろうか。もし子どもの成績を上げるために子どもの足のサイズを大きくしようとしたら、それはおかしなことと思われるだろう。

これは単なる相関関係を因果関係と誤認している。現実にはこのように因果関係がないにもかかわらず、相関関係は観測される現象が存在する。そこで本稿では、この例のような因果関係がないにもかかわらず、相関関係が見られる現象が生じる理由や変数間の関係を見抜くために注意すべきポイントについて解説する。

因果関係と相関関係はどう違うのか

先ほど示した散布図に現れたような関係が生じる理由を説明する前に、まずは因果関係と相関関係の定義を説明しよう。

因果関係とは2つの変数の間に原因と結果の関係があることをいう。原因と結果の関係とは、原因となる変数が変化すると、それに伴って結果となる変数も変化する関係のことである。例えば、勉強時間を増やす、もしくは増えることが原因で学力テストの点数が高くなるのであれば、これらの変数の間には因果関係があるといえる。

相関関係とは2つの変数があるときに、片方の変数が大きければ、もう一方の変数も大きいといったような2つの変数間に、ある一定の関係が成立しているだけのことをいう。

そのため、因果関係とは異なり、片方の変数を変化させたときに、もう一方の変数がそれに伴って変化するという原因と結果の関係はない(本来相関関係と因果関係は明確に区別できるものではないが、本稿では説明のために相関関係とは因果関係を含まないものとしている)。片方の変数が大きいときにもう一方の変数が小さいというような逆の関係でも同様に相関関係があるという。

先ほどの例でいえば、靴のサイズが大きい子は学力テストの点数も高い、もしくは低いなどの関係が見られれば、相関関係があるといえる。今回は靴のサイズが大きい子は学力テストの点数も高いという前者の関係がありそうだ。また、2つの変数は原因と結果の関係ではないので、学力テストの点数が高い子は靴のサイズも大きいと言いかえてもよい。

冒頭の靴のサイズと学力テストの結果の関係は、相関関係はあるけれども因果関係はないという例になっている。

次ページなぜそうなってしまうのか?
関連記事
トピックボードAD
キャリア・教育の人気記事
トレンドライブラリーAD
連載一覧
連載一覧はこちら
人気の動画
日本の「パワー半導体」に一石投じる新会社の誕生
日本の「パワー半導体」に一石投じる新会社の誕生
猛追のペイペイ、楽天経済圏に迫る「首位陥落」の現実味
猛追のペイペイ、楽天経済圏に迫る「首位陥落」の現実味
ホンダディーラー「2000店維持」が簡単でない事情
ホンダディーラー「2000店維持」が簡単でない事情
【浪人で人生変わった】30歳から東大受験・浪人で逆転合格!その壮絶半生から得た学び
【浪人で人生変わった】30歳から東大受験・浪人で逆転合格!その壮絶半生から得た学び
アクセスランキング
  • 1時間
  • 24時間
  • 週間
  • 月間
  • シェア
会員記事アクセスランキング
  • 1時間
  • 24時間
  • 週間
  • 月間
トレンドウォッチAD
東洋経済education×ICT