「こちらは、ドクターズコスメと、比較のために弊社の他製品を使用してもらった、モニター100名の方の満足度の回答です。満足度は満点を100点としています。性別と年齢としてはF1層で、居住地や職業などに偏りはありません。結果としては、弊社の類似の他製品との満足度の差は10%もあり、優れていたことがわかりました」
「このグラフは、それぞれ100名のデータの平均値を表しているんだね」と、班目教授が訊いてきた。
「その通りです」
「たしかに両者で差があることが、このグラフからわかる。さて、我々研究者がこのようなグラフを見たときに気になるのが、母集団がどれぐらいバラついているか、だ」
「母集団……ですか?」
「例えば、この世界に存在するドクターズコスメの利用者は、このアンケートに協力してくれた100名だけかな?」
「そんなことはありません。利用者は何万人もいます」
「そう、その利用者全体のことを統計学の世界では母集団という。そしてアンケートに協力してくれた人の回答を標本という」
母集団:そのコスメの利用者全体のこと。利用者全体のアンケートは取れない
標本:そのコスメの利用者のなかで、アンケートに答えた一部の人のこと
「母集団のデータは取りようがない……だから標本のデータを集めてきて、標本の平均値を求めて比較する……ということを私たちはしているのです」
「そうだ。貴君たちが欲しいのは、母集団の情報か? それとも標本の情報?」
私は三田村さんと片栗課長の顔を見た。2人とも不思議そうな顔をしていた。
「そりゃあ、母集団の情報が欲しいです。それぞれのコスメの利用者全体(母集団)のことを理解しようとして、アンケート(標本)を取っているのですから」
「そうだな、研究者たちも同じように考える。そこで標準偏差、正確には不偏標準偏差というものを用いて、母集団のデータのバラツキを推定するんだ」
そのグラフは意図的に作られていないか?
「母集団のバラツキが推定できる……それはどのようなものですか?」
「今回のコスメのアンケートの場合、100点満点で満足度を回答してもらっているんだよね。その点数が、このコスメを利用する全員のなかで、どれくらいバラついているかということが推測できるんだ」
「どれほどそのコスメに対する意見が分かれているか……ということですね」
片栗課長が横から言った。
「その通り。では、このグラフに、不偏標準偏差を付け足してみよう。貴君、生データ……このグラフを作るときに使用したデータはあるかな?」
私は慌ててノートパソコンの中のファイルを探した。私は先ほどのグラフをExcelソフトで作成していた。そのExcelのファイルを見つけて、ノートパソコンごと班目教授に渡した。彼は恐ろしいほどの速度でキーボードをたたき、計算をし始めた。やがて、次のようなグラフができた。
無料会員登録はこちら
ログインはこちら