東洋経済オンラインとは
キャリア・教育 #確かなリアルが見えてくる 「統計」超入門

データに根拠を求める人が陥りやすい「罠」の正体 「顧客満足度95%」広告のあやしさを説明できる?

8分で読める
  • 増田 純也 インテージ 先端技術部、滋賀大学データサイエンス学部インダストリーアドバイザー
2/4 PAGES
3/4 PAGES
④集計方法は適切か

データや述べている事柄に対して、適切な集計がなされているかを考えてもらいたい。

集計方法で最も有名なのは「平均」だろう。学校でのテスト結果が返却されるとき、同時に平均点といった形で告げられるので知っている人は多いだろう。平均は「すべてのデータを足して、データ数で割る」ことで、全体の中央の値を計算する。このような計算の平均を、正式には「算術平均」と呼ぶ。

算術平均で起こりやすいミス

なじみ深い算術平均であるが、「売り上げの成長率」といったパーセントのデータで計算してしまうと問題が生じる。以下は、ある企業の6年間の売り上げ推移と成長率を表したものである。

■ある企業の売上高と前年比の伸び率
1年目:100万円
2年目:120万円(120.0%)
3年目:180万円(150.0%)
4年目:170万円(94.4%)
5年目:220万円(129.4%)
6年目:250万円(113.6%)
(注)カッコ内が前年比伸び率、便宜的に小数第2位を四捨五入(以下同様)

この場合、算術平均で平均成長率を計算すると、毎年121.5%で成長しているということになる。

●算術平均
(120.0%+150.0%+94.4%+129.4%+113.6%)/5=121.5%

だが、それは正しいのだろうか。1年目の100万円から毎年121.5%ずつ成長したと考えて計算してみると、6年目の売り上げは以下のように264.8万円となり、本来の250万円から14.8万円のズレが生じる。

100万円×1.215×1.215×1.215×1.215×1.215=264.8万円

つまり、平均成長率を過大に計算してしまっているのだ。このようなパーセントのデータに対しては「幾何平均」という計算方法を使うのが正しい(エクセルで計算する場合はGEOMEAN関数を使うとすぐ算出できる)。

●幾何平均
(120.0%×150.0%×94.4%×129.4%×113.6%)の5乗根=120.1%

幾何平均で計算した結果を用いれば、6年目の売り上げにズレはなく、平均成長率を正確に計算できていることがわかる。

100万円×1.201×1.201×1.201×1.201×1.201=249.8万円

平均成長率の集計方法の間違いはよく見かけるので、注意してほしい。

4/4 PAGES

こちらの記事もおすすめ

あなたにおすすめ

キャリア・教育

人気記事 HOT

※過去1ヶ月以内に配信した記事の閲覧数