データ分析において、それに先立つデータの可視化は大事なステップである。データに含まれる情報が一目で見られるようになれば、思いも寄らない事実や、より深く探究するべきポイントが浮き彫りになるだろう。
2次元では表せない情報
しかし可視化には根本的な限界がある。2次元、つまり平面上に表せないものは、人間の目では一望できないのである。
平面上に表せるデータには、例えば地図上の位置情報がある。「緯度」と「経度」は、それぞれ縦軸と横軸で表せるからだ。
では、平面上に図示できないデータとは何だろうか。答えは、3次元以上のデータ、つまり1人につき3項目以上の数値を含むデータだ。
位置情報の例でいうと、緯度と経度と標高くらいまでなら、何とか3Dマップで表示できそうだ。しかし、「高校のクラス全員の全科目の成績」のようなデータは、1枚の図ではとても表現できない。もし国語を縦軸、数学を横軸で表すなら、英語や世界史や生物の成績を書き込むための軸は、もうない。かといって、生徒一人ひとりや科目ごとに別のグラフを用意したら、複数教科間の関連性は見えにくくなってしまう。
この記事は会員限定です。登録すると続きをお読み頂けます。
登録は簡単3ステップ
東洋経済のオリジナル記事1,000本以上が読み放題
おすすめ情報をメルマガでお届け
無料会員登録はこちら
ログインはこちら