「データ分析」が客観的・公平でないその根拠

数字の見方次第でまったく違う結果になる

「部分」を見ずに「全体」の見えかただけで判断することの危うさとは(写真:HILLS LIFE DAILY)
イギリスの統計学者が発表した論文に由来する「シンプソンのパラドックス」は、データの「部分」を見るか「全体」を見るかで、まったく異なる結論が導かれる可能性があることを忠告する。バイアスを助長しかねないこの「データの危険性」について、事例を挙げながら解説する。

「平均値のわな」にハマる

ある国の政府が、国民の所得の状況について、次のような発表をしたとしよう。

「今年、我が国では、年間所得1000万円以上の高所得者層、1000万円以下の低所得者層、どちらの層でも平均所得が増加しました。これは、国民全体の平均所得が向上していることを示すものであります」

当記事は「HILLS LIFE DAILY」(運営:コンデナスト・ジャパン)の提供記事です

所得の調査結果は正しいと仮定して、政府のこの見解は正しい、と言えるだろうか。すなわち、高所得者層も低所得者層も平均所得が上がっている時、国民全体の平均所得も向上している、と結論づけていいのだろうか。

直感的には、そんなの当たり前じゃないか、と思える。高所得者層も低所得者層も平均所得が増えたのなら、それらを足し合わせた国民全体の平均所得も当然、増えているはず。そう考えるのは極めて自然だ。

しかし、実は必ずしも、そうとは言えないのだ。図を見ながら、具体的な例で考えてみよう。

A、B、C、Dという4名の年収グラフ(図:HILLS LIFE DAILY)

今、高所得者2人(A、B)、低所得者2人(C、D)の合計4人の国民がいるとしよう。そして、高所得者層の2人の一昨年の年間所得は、それぞれ2000万円と1200万円、低所得者層の2人は、それぞれ700万円と300万円だったとする。

次ページ直感で出した答えは正しいか
ライフの人気記事
トピックボードAD
関連記事
  • 実践!伝わる英語トレーニング
  • 非学歴エリートの熱血キャリア相談
  • 中原圭介の未来予想図
  • 貧困に喘ぐ女性の現実
トレンドライブラリーAD
  • コメント
  • facebook
0/400

コメント投稿に関する規則(ガイドライン)を遵守し、内容に責任をもってご投稿ください。

アクセスランキング
  • 1時間
  • 24時間
  • 週間
  • 月間
  • シェア
トレンドウォッチAD
沸騰! 再開発バトル<br>「不動産好況」はいつまで続く

東京をはじめ、地方都市でも活況が続く都市再開発。人口減少時代に過剰感はないのか。ベンチャーの聖地を争う東急・三井両不動産、再開発で「浮かんだ街・沈んだ街」、制度を巧みに使う地上げ最新手法など、多方面から街の表と裏の顔を探る。