例えば、ある小学校の児童をランダムに20人選び、何らかの学力テストを受けてもらったとしよう。この散布図の縦軸がそのテストの得点で横軸がその小学生の靴のサイズだとしても同じように考えることができるだろうか。つまり、小学生は足のサイズを大きくすれば、勉強ができるようになると考えるだろうか。もし子どもの成績を上げるために子どもの足のサイズを大きくしようとしたら、それはおかしなことと思われるだろう。
これは単なる相関関係を因果関係と誤認している。現実にはこのように因果関係がないにもかかわらず、相関関係は観測される現象が存在する。そこで本稿では、この例のような因果関係がないにもかかわらず、相関関係が見られる現象が生じる理由や変数間の関係を見抜くために注意すべきポイントについて解説する。
因果関係と相関関係はどう違うのか
先ほど示した散布図に現れたような関係が生じる理由を説明する前に、まずは因果関係と相関関係の定義を説明しよう。
因果関係とは2つの変数の間に原因と結果の関係があることをいう。原因と結果の関係とは、原因となる変数が変化すると、それに伴って結果となる変数も変化する関係のことである。例えば、勉強時間を増やす、もしくは増えることが原因で学力テストの点数が高くなるのであれば、これらの変数の間には因果関係があるといえる。
相関関係とは2つの変数があるときに、片方の変数が大きければ、もう一方の変数も大きいといったような2つの変数間に、ある一定の関係が成立しているだけのことをいう。
そのため、因果関係とは異なり、片方の変数を変化させたときに、もう一方の変数がそれに伴って変化するという原因と結果の関係はない(本来相関関係と因果関係は明確に区別できるものではないが、本稿では説明のために相関関係とは因果関係を含まないものとしている)。片方の変数が大きいときにもう一方の変数が小さいというような逆の関係でも同様に相関関係があるという。
先ほどの例でいえば、靴のサイズが大きい子は学力テストの点数も高い、もしくは低いなどの関係が見られれば、相関関係があるといえる。今回は靴のサイズが大きい子は学力テストの点数も高いという前者の関係がありそうだ。また、2つの変数は原因と結果の関係ではないので、学力テストの点数が高い子は靴のサイズも大きいと言いかえてもよい。
冒頭の靴のサイズと学力テストの結果の関係は、相関関係はあるけれども因果関係はないという例になっている。
無料会員登録はこちら
ログインはこちら