「データ分析」が客観的・公平でないその根拠 数字の見方次第でまったく違う結果になる

拡大
縮小
「部分」を見ずに「全体」の見えかただけで判断することの危うさとは(写真:HILLS LIFE DAILY)
イギリスの統計学者が発表した論文に由来する「シンプソンのパラドックス」は、データの「部分」を見るか「全体」を見るかで、まったく異なる結論が導かれる可能性があることを忠告する。バイアスを助長しかねないこの「データの危険性」について、事例を挙げながら解説する。

「平均値のわな」にハマる

ある国の政府が、国民の所得の状況について、次のような発表をしたとしよう。

「今年、我が国では、年間所得1000万円以上の高所得者層、1000万円以下の低所得者層、どちらの層でも平均所得が増加しました。これは、国民全体の平均所得が向上していることを示すものであります」

当記事は「HILLS LIFE DAILY」(運営:コンデナスト・ジャパン)の提供記事です

所得の調査結果は正しいと仮定して、政府のこの見解は正しい、と言えるだろうか。すなわち、高所得者層も低所得者層も平均所得が上がっている時、国民全体の平均所得も向上している、と結論づけていいのだろうか。

直感的には、そんなの当たり前じゃないか、と思える。高所得者層も低所得者層も平均所得が増えたのなら、それらを足し合わせた国民全体の平均所得も当然、増えているはず。そう考えるのは極めて自然だ。

しかし、実は必ずしも、そうとは言えないのだ。図を見ながら、具体的な例で考えてみよう。

A、B、C、Dという4名の年収グラフ(図:HILLS LIFE DAILY)

今、高所得者2人(A、B)、低所得者2人(C、D)の合計4人の国民がいるとしよう。そして、高所得者層の2人の一昨年の年間所得は、それぞれ2000万円と1200万円、低所得者層の2人は、それぞれ700万円と300万円だったとする。

次ページ直感で出した答えは正しいか
関連記事
トピックボードAD
ライフの人気記事
トレンドライブラリーAD
連載一覧
連載一覧はこちら
人気の動画
日本の「パワー半導体」に一石投じる新会社の誕生
日本の「パワー半導体」に一石投じる新会社の誕生
猛追のペイペイ、楽天経済圏に迫る「首位陥落」の現実味
猛追のペイペイ、楽天経済圏に迫る「首位陥落」の現実味
ホンダディーラー「2000店維持」が簡単でない事情
ホンダディーラー「2000店維持」が簡単でない事情
【浪人で人生変わった】30歳から東大受験・浪人で逆転合格!その壮絶半生から得た学び
【浪人で人生変わった】30歳から東大受験・浪人で逆転合格!その壮絶半生から得た学び
アクセスランキング
  • 1時間
  • 24時間
  • 週間
  • 月間
  • シェア
会員記事アクセスランキング
  • 1時間
  • 24時間
  • 週間
  • 月間
トレンドウォッチAD
東洋経済education×ICT