「さらに、不偏標準偏差の2倍のエラーバーをつけると、その範囲に母集団の96%が含まれることが期待される。母集団のデータがどの範囲に収まっているか、そしてどれくらいバラついているかを推定できる。これが統計学の威力だ。このエラーバーが大きいほど、そのコスメの利用者全体(母集団)のデータがバラついている……すなわち課長殿が言ったように、どれほどそのコスメに対する意見が分かれているか……ということが推定できる」
私はグラフのエラーバーをじっと見た。
「若干ですが、弊社他製品と比較して、ドクターズコスメのエラーバーが大きいように見えます。不偏標準偏差が大きいということは、商品に大満足している人もいれば、まったく気に入らない人もいる傾向が強いということを表しているんですね」
私はエラーバーをつける意味、その大きさの意味、そしてエラーバーが重なっていることの意味が理解できた。
そのデータは正規分布をとるか?
そこまでいって班目教授は、言いにくそうな顔をした。
「ひとつ言っていなかったことがある。標準偏差の範囲に全体の68%のデータが含まれるというのは、データが正規分布をしているときにのみ成り立つ話なんだ」
「正規分布……?」
私がぽかんとしている様子を見て、班目教授は説明を続けた。
「貴君の調査のように、横軸が顧客満足度、縦軸がその満足度を回答したモニターの人数……そのようなグラフを描いた場合、平均値を中心として釣鐘状になれば、正規分布をとっているといえる」
「一般的に、どういうものが正規分布をとるのですか?」
「例えば自動車の事故の頻度や、降ってくる雨粒の直径は正規分布をとる例として有名だ。貴君たちが先ほど口にした、赤信号で車が止まる事象は、正規分布に従うかもしれない」
「帰り道にデータをとってみますかね?」
片栗課長が楽しそうに言った。班目教授は笑った。
「それでは貴君たちのデータを確認してみよう。このグラフのような平均値としてまとめたものではなく、それぞれのモニターの顧客満足度の回答がわかるデータはあるかね?」
平均値を出す前の生のデータ、ということだ。もちろん私は、平均値を計算するためにそのデータを持っていた。私はそれらのデータをディスプレイに表示した。
無料会員登録はこちら
ログインはこちら