「これがモニター100名の顧客満足度だね。先に見た平均値と再頻値(最も多く現れる値)と中央値(分布の中心)が一致するので、正規分布をとると考えていい。正規分布の話から、別の大切なことが見えてくる。正規分布をとらないような場合、平均値だけで分析すると本質が見えないことがある」
「年収を例にとって考えよう。ある年の日本全体の男女の平均年収は461万円、年収の中央値は433万円だった。30万円ほどの差がある。この差はどこから来るかというと、計算方法に他ならない。平均値は、年収が極めて高額な希な場合の影響を受けて、中央値より高めに現れる。一方で中央値は、その値までに含まれる人数が全体の50%であるので、一般的な感覚に近いと言えるね」
平均値だけで終わるのはもったいない
班目教授はホワイトボードを指さした。
「ここまでの話をまとめよう。つまり、平均値だけを求めて終わりというのはもったいない。生のデータを見て、そこから平均値として評価するのか、中央値として評価するのかを決めたり、不偏標準偏差を求めて、母集団のバラツキを推定することは重要だ」
「そういった思考が働かず、平均値だけを評価すれば、『ものすごく低い値・もしくは高い値』の存在を見落とすことになる。先ほどの場合だと、ドクターズコスメに著しく悪い評価を与えている人たちの存在を見落としてしまうことになる」
「なるほど、そこにビジネスチャンスを見出す可能性があるかもしれませんね」
片栗課長はつぶやくように言った。
記事をマイページに保存
できます。
無料会員登録はこちら
ログインはこちら
印刷ページの表示はログインが必要です。
無料会員登録はこちら
ログインはこちら
無料会員登録はこちら
ログインはこちら