「データ分析」が客観的・公平でないその根拠

数字の見方次第でまったく違う結果になる

「部分」を見ずに「全体」の見えかただけで判断することの危うさとは(写真:HILLS LIFE DAILY)
イギリスの統計学者が発表した論文に由来する「シンプソンのパラドックス」は、データの「部分」を見るか「全体」を見るかで、まったく異なる結論が導かれる可能性があることを忠告する。バイアスを助長しかねないこの「データの危険性」について、事例を挙げながら解説する。

「平均値のわな」にハマる

ある国の政府が、国民の所得の状況について、次のような発表をしたとしよう。

「今年、我が国では、年間所得1000万円以上の高所得者層、1000万円以下の低所得者層、どちらの層でも平均所得が増加しました。これは、国民全体の平均所得が向上していることを示すものであります」

当記事は「HILLS LIFE DAILY」(運営:コンデナスト・ジャパン)の提供記事です

所得の調査結果は正しいと仮定して、政府のこの見解は正しい、と言えるだろうか。すなわち、高所得者層も低所得者層も平均所得が上がっている時、国民全体の平均所得も向上している、と結論づけていいのだろうか。

直感的には、そんなの当たり前じゃないか、と思える。高所得者層も低所得者層も平均所得が増えたのなら、それらを足し合わせた国民全体の平均所得も当然、増えているはず。そう考えるのは極めて自然だ。

しかし、実は必ずしも、そうとは言えないのだ。図を見ながら、具体的な例で考えてみよう。

A、B、C、Dという4名の年収グラフ(図:HILLS LIFE DAILY)

今、高所得者2人(A、B)、低所得者2人(C、D)の合計4人の国民がいるとしよう。そして、高所得者層の2人の一昨年の年間所得は、それぞれ2000万円と1200万円、低所得者層の2人は、それぞれ700万円と300万円だったとする。

次ページ直感で出した答えは正しいか
ライフの人気記事
トピックボードAD
関連記事
  • インフレが日本を救う
  • 会社を変える人材開発の極意
  • 非学歴エリートの熱血キャリア相談
  • 賃金・生涯給料ランキング
トレンドライブラリーAD
  • コメント
  • facebook
-

コメント投稿に関する規則(ガイドライン)を遵守し、内容に責任をもってご投稿ください。

ログインしてコメントを書く(400文字以内)
アクセスランキング
  • 1時間
  • 24時間
  • 週間
  • 月間
  • シェア
トレンドウォッチAD
ニセコ 熱狂リゾートの実像<br>開発に翻弄される小さな北の町

「パウダースノー」を求め、北海道のニセコに殺到する外国人客。その数は住民約2万人の14倍にも及びます。観光ばかりでなく、別荘が建ち不動産投資も活発化しましたが、地価高騰やインフラ整備負担による財政圧迫の問題も出ています。活況と苦悩の両面に迫りました。