知ると便利「膨大なデータから潜在顧客見抜く」技 データを類似性で分類する「クラスター分析」

✎ 1〜 ✎ 5 ✎ 6 ✎ 7 ✎ 8
著者フォロー
ブックマーク

記事をマイページに保存
できます。
無料会員登録はこちら
はこちら

印刷ページの表示はログインが必要です。

無料会員登録はこちら

はこちら

縮小

非階層クラスター分析の長所は、前述の階層クラスター分析よりも計算量が軽く、データが多くても分析に耐えうる点である。そのため、ビッグデータに対してクラスター分析を行う場合は非階層クラスター分析を用いることが多い。

短所は、事前に決めたクラスター数に従うため、クラスター数が少なすぎればざっくりとした分類にしかならず、多すぎれば細かすぎて解釈が難しい分類になってしまうという点である。そのため実務的には、クラスター数をいくつか試して、その傾向を確認することで何クラスター作成するのが最適かを探索することが多い。

また初期値依存という、統計ソフトがランダムに決める初期値(各クラスターの中心になる点)に分析結果が依存してしまう問題点もある。この問題に対処したい場合は、初期値を変えて複数回計算して最適値を探索するなどの方法がある。

表1で例に挙げた価値観の因子得点データ100人で非階層クラスター分析を行い、データを4つのクラスターに分類したとしよう。「健康志向」「簡便志向」「節約志向」の各指標の大小を基に、類似度が高い回答者同士が同じクラスターにまとめられ、各回答者は1~4いずれかのクラスターに振り分けられる。(1~4は名義上の番号で、数字自体にとくに意味はない)

この時点では各クラスターがどのような特徴を持つかわからないため、クラスターごとに指標の平均値を計算する(表2)。

表2:クラスターごとの平均因子得点

クラスター サンプル数 健康志向 簡便志向 節約志向
1 300 0.31 0.26 1.89
2 200 2.27 0.10 0.42
3 100 1.75 0.14 1.60
4 400 0.13 2.15 0.21

表2を見ると、以下のようなクラスターごとの特徴がはっきりと出ているのが見て取れる。

クラスター1:安い商品を選ぶことを意識
クラスター2:特保系飲料や健康食品などの商品を好む
クラスター3:節約しつつも、体に良い商品を選ぼうとしている
クラスター4:コンビニやファストフード店など便利な店舗を使う傾向が強い

このように、データの分類とその解釈を行うことができる。ただし当然、分類はクラスター分析に用いた指標でしか行われないので注意されたい。例えば「ブランド志向」という価値観をさらに分類軸として加えたい場合は、それを指標として用意する必要がある。

ほかのデータと組み合わせて掘り下げることも可能

このようにクラスターを作成した時点で、施策のターゲットを絞るなど分析結果を十分に活用できる。しかし、さらにほかのデータと組み合わせて集計・分析を進めることが多い。

例えばあなたが特保系飲料のマーケティング担当者であれば、表2の1000人の購買履歴データを集計して、自社の飲料を購入しているのがどのクラスターなのか、そのクラスターがほかに購入している競合商品はどれなのか、などといった形でデータを掘り下げていくことができる。

本記事では、複数の指標を基にデータを分類するクラスター分析を紹介した。今回の例ではアンケート回答者の因子得点データを例にしたが、クラスター分析は人のデータに限らず用いることができる。例えば、ドラッグストアの店舗ごとの売り上げデータを使って、客層が似ている店舗を分類することもできる。

活用の幅は広いので、何らかのデータからターゲティングを行いたい際には使ってみてはいかがだろうか。

穴澤 純也 インテージ 事業開発本部 先端技術部

著者をフォローすると、最新記事をメールでお知らせします。右上のボタンからフォローください。

あなざわ じゅんや / Junya Anazawa

筑波大学大学院社会工学専攻サービス工学学位プログラム修了後、2019年4月インテージに入社。主に、アンケート調査データやPOSデータ、広告接触データなどの分析業務に従事。

この著者の記事一覧はこちら
ブックマーク

記事をマイページに保存
できます。
無料会員登録はこちら
はこちら

印刷ページの表示はログインが必要です。

無料会員登録はこちら

はこちら

関連記事
トピックボードAD
キャリア・教育の人気記事