「花粉の飛散が始まる日」を予報できる納得の理由 子どもが「算数好き」になる!統計知識6選
統計学のビッグデータ解析ってなに?
人々の行動データをたくさん集めてパターンを探したりするんだ。
【これがヒミツ!】
(1)世界中を大量のデータが飛び交っている
世界では1日に10エクサバイト以上ものデジタルデータが行き交っているといわれています。このように日々、生まれてくる巨大なデータをビッグデータといいます。
(2)毎日の生活からデータが集められている
ビッグデータは、人々がネットを見たり、買物をしたり、メールを送ったり、SNSに書き込みをしたり、電車や自動車で移動したりすることで生まれています。統計学を活用して、このデータを分析し、特徴を見つけ、ビジネスや暮らしに役立つ情報を引き出すことが、ビッグデータ解析の目的です。
(3)データを分析して特徴を探す
データの分析方法には、複雑で大量のデータから重要な相関関係を見つける「主成分分析」、時系列に沿って数値を整理する「時系列分析」、同じ要素を持ったデータだけを浮かび上がらせる「クラスター分析」などがあります。こうして分析して得られた結果をさらに深掘りし、データの解析を進めます。
湖全体の魚の数はどうやって数える?
a 湖の水を全部抜いてつかまえて数える
b 何匹かつかまえて目印をつけて湖に戻す
c ダイバーが潜って、一定区画にいる魚の数を数える
再びつかまえた魚に印つきが含まれる割合で計算する。
【これがヒミツ!】
(1)野生動物の数を推定する捕獲再捕獲法
山や湖などを動きまわる生き物は、すべてを数えることはできません。数を知りたいときは、統計学の捕獲再捕獲法という方法で、およその数を推定できます。
(2)つかまえた動物に印をつけて自然に帰す
湖のフナの数を知りたいときは、まず、その湖で適当な数のフナをつかまえ、目印などの標識をつけたら、湖に戻します。ある程度期間をおいてから、再び適当な数のフナをつかまえます。目印のあるフナと、ないフナが混ざっているはずです。
(3)印があるのは何匹?
「湖全体のフナのうち目印のあるフナの割合(A)」と「2回目につかまえたフナのうち目印のあるフナの割合(B)」は同じであると考えます。最初に30匹に目印をつけ、2回目に20匹をつかまえたところ、2匹に目印がついていたとします。Bの割合は10%です。そこで、最初の30匹も、湖全体(100%)のフナの10%に当たると考えます。すると、湖全体では約300匹くらいだろうと推定できます。
無料会員登録はこちら
ログインはこちら