自社製品・サービスを改善につなげるために顧客ニーズを調査しデータを解析することはとても重要ですよね。
近年では人工知能(AI)によって分析する企業も増えてきています。
そんなデータ分析をするときに活用できるのが「クラスター分析」です!
今回はクラスター分析について解説していきます。
クラスター分析とは?
クラスター分析とは、大きな集団(ビッグデータ)の中から似たもの同士を集めて(クラスター)対象を分類するマーケティングにおける調査分析手法のことです。
対象となるのは人間だけではなく、商品や地域、企業が対象となることもあります。
クラスター分析はターゲット分析やペルソナ分析の際に使われることが多く、有効な判断軸がわからないデータの切り口を自動的に探し出してくれます。
クラスター分析で可能なことは大まかに「分類」と「判別」です。数値をもとに計算をするので科学的で客観的な分析手法であるといえます。
具体的には以下の通りです。
- ブランドのポジショニング分析
- 顧客層の特性分け分析
- 店舗の取り扱い商品構成の分析
- 生活者のセグメンテーション
クラスター分析の種類
クラスター分析の手法は大きく分けて2つあります。
以下ではそれぞれの手法について解説していきます。
階層クラスター
階層クラスター分析とは、分析するデータのうちの最も似ている組み合わせから組を作っていくという手法です。階層クラスターはデータ量が増えると計算量も大きく増加するので、膨大なデータを分析することには向いていません。
階層クラスター分析を行うと以下のようなデンドログラム(樹形図)が出力され、各クラスターが結合されていくのを見ることができます。
このようにトーナメント表のような樹形図が作成され、データの構成を可視化することができます。クラスターの数を事前に決めなくても樹形図であれば判断しやすいですよね。
階層クラスター分析のやり方には色々な種類がありますが、今回は覚えておきたい「ウォード法」と「群平均法」の2種類をご紹介します。
ウォード法
ウォード法とは、あらかじめ設定してある目標のクラスター数になるまで近いクラスター順に結合し続けるという手法です。
ウォード法は目標クラスター数になるまでクラスターの結合を繰り返すので計算量が膨大になりますが、その分分類される感度が高く信頼度が高い統計が取れます。
群平均法
群平均法とは、2つのクラスターに属した対象一つ一つのすべての距離を求め、その平均値を2クラスター感の距離になるということです。図に表すと以下のようになります。
群平均法は一つのクラスターにその他のクラスターが吸収されていく現象(鎖効果)を防いでくれるという点でウォード法の代用案として考えられています。
非階層クラスター
次に非階層クラスターについての説明です。
非階層クラスターとは、あらかじめ目標クラスター数を設定しておき、階層クラスターのような樹形図(階層)を持たずに似たサンプルを近くに集め、似ていないサンプルを遠ざけていくという手法です。
樹形図(階層)を持たないという点で規模の大きなデータや異なった種類が多く集まるデータを分析するのに適しています。
K-means 法
非階層分析において最も代表的な計算手法である「K-MEANS法」をご紹介します。
K-means法はあらかじめ設定したクラスター数(K個)だけランダムに重心が設定され、各重心ごとにクラスタリングされた集団の距離を計算していくというものです。以下が図になります。
図を見てわかる通り、すべてのサンプル間の距離を計算する階層クラスターと比べて圧倒的に計算量が少なくて済むのがわかりますよね。
しかしあらかじめ決めなければいけない目標クラスター数を決める公式はまだなく、何種類か試すことが一般的です。さらに重心をランダムで決めるため、分析するたびに結果が変わってしまうという事態も起こります。
つまりまとめると、ビッグデータを分析するには「非階層クラスター」、スモールデータや分析の質を求めるなら「階層クラスタ―」が適しているということです。
クラスター分析の流れ
上の項ではどちらかというと学問的なクラスタ―分析の説明をしました。しかしこれだけでは分析結果をどう生かせばいいのかという疑問が浮かぶはずです。
そこで以下では、分析結果をマーケティングとして生かす事前調査・結果の解釈について解説します。
例:自社商品購入者の特性分析
今回の例ではクラスター分析の際に分類するためのデータ元は
- 市場調査
- 顧客アンケート
- クレジットカードなどの顧客情報
などが挙げられます。
これらの調査方法には顧客の性別や年齢、住所が含まれていることが好ましいです。
そしてこれらから得られたデータをもとに
- 低関心層
- 流行追及層
- 高級品層
- 保守層
というようにプロファイリング(分類)することができます。
このように分類することで、データ全体の傾向を把握しやすくなります。さらにこの分類から顧客の志向に合わせた商品の紹介をDMやメルマガで送ることもできます。
クラスター分析の注意点
クラスタ―分析の注意すべき点はズバリ他の分析方法との併用が必須であるという点です。
クラスタ―分析はあくまで「分類」の一手法にすぎません。分類結果がどんな法則性によって生じたかまではクラスタ―分析では分かりえないのです。
したがって、分類された結果を業務として生かすためにはクラスター分析だけで判断しないことが大切です。相関分析などのほかの分析方法も活用してなるべく多面的な分析結果が得られるようにすることが好ましいです。
クラスター分析のまとめ
いかがでしたでしょうか?
クラスター分析によって異なる種類のデータを分類することやビッグデータを科学的に分析することが可能になります。
この機会に自社のマーケティングにクラスタ―分析を活用してみてはどうですか?