現役研究者が教える「データの効果的な分析手法」 プレゼンに欠かせない「納得させる」技術を紹介

✎ 1 ✎ 2 ✎ 3
著者フォロー
ブックマーク

記事をマイページに保存
できます。
無料会員登録はこちら
はこちら

印刷ページの表示はログインが必要です。

無料会員登録はこちら

はこちら

縮小

「こちらは、ドクターズコスメと、比較のために弊社の他製品を使用してもらった、モニター100名の方の満足度の回答です。満足度は満点を100点としています。性別と年齢としてはF1層で、居住地や職業などに偏りはありません。結果としては、弊社の類似の他製品との満足度の差は10%もあり、優れていたことがわかりました」

「このグラフは、それぞれ100名のデータの平均値を表しているんだね」と、班目教授が訊いてきた。

「その通りです」

「たしかに両者で差があることが、このグラフからわかる。さて、我々研究者がこのようなグラフを見たときに気になるのが、母集団がどれぐらいバラついているか、だ」

「母集団……ですか?」

「例えば、この世界に存在するドクターズコスメの利用者は、このアンケートに協力してくれた100名だけかな?」

「そんなことはありません。利用者は何万人もいます」

「そう、その利用者全体のことを統計学の世界では母集団という。そしてアンケートに協力してくれた人の回答を標本という」

(例えばあるコスメの場合)
母集団:そのコスメの利用者全体のこと。利用者全体のアンケートは取れない
標本:そのコスメの利用者のなかで、アンケートに答えた一部の人のこと

「母集団のデータは取りようがない……だから標本のデータを集めてきて、標本の平均値を求めて比較する……ということを私たちはしているのです」

「そうだ。貴君たちが欲しいのは、母集団の情報か? それとも標本の情報?」

私は三田村さんと片栗課長の顔を見た。2人とも不思議そうな顔をしていた。

「そりゃあ、母集団の情報が欲しいです。それぞれのコスメの利用者全体(母集団)のことを理解しようとして、アンケート(標本)を取っているのですから」

「そうだな、研究者たちも同じように考える。そこで標準偏差、正確には不偏標準偏差というものを用いて、母集団のデータのバラツキを推定するんだ」

そのグラフは意図的に作られていないか?

「母集団のバラツキが推定できる……それはどのようなものですか?」

「今回のコスメのアンケートの場合、100点満点で満足度を回答してもらっているんだよね。その点数が、このコスメを利用する全員のなかで、どれくらいバラついているかということが推測できるんだ」

「どれほどそのコスメに対する意見が分かれているか……ということですね」

片栗課長が横から言った。

「その通り。では、このグラフに、不偏標準偏差を付け足してみよう。貴君、生データ……このグラフを作るときに使用したデータはあるかな?」

私は慌ててノートパソコンの中のファイルを探した。私は先ほどのグラフをExcelソフトで作成していた。そのExcelのファイルを見つけて、ノートパソコンごと班目教授に渡した。彼は恐ろしいほどの速度でキーボードをたたき、計算をし始めた。やがて、次のようなグラフができた。

次ページ班目教授が作ったグラフとは?
関連記事
トピックボードAD
キャリア・教育の人気記事