tpu键盘膜吸塑模具:第十四周:聚类分析应用与市场细分——每周一讲多变量分析

来源:百度文库 编辑:偶看新闻 时间:2024/04/29 05:43:42

第十四周:聚类分析应用与市场细分——每周一讲多变量分析

标签: 统计分析  市场研究  聚类  模型评估  研究方法  分类: 统计分析 2010-11-28 10:12

    上一篇博客提到聚类分析方法和基本概念,但是可能没有回答一些人的疑问?比如到底应该分成多少类,类的稳定性以及如何评估聚类的结果。其实,要想解决这个问题,首先是要与分析目的有关,不简单是一个统计分析问题,或者说聚类问题,而应该是研究者的判断或者说研究者的洞察力,当然,我们还是要有一套方法去指导。

      但大家记住:聚类分析不是统计方法,是一种数据处理技术,也就是说在SPSS里面,有时候你的数据排序改变,聚类的结果都会改变;

      还要记住:如果市场上不存在明显的细分市场,只要聚类总是能够按照聚类要求分成类的,这时候你就要注意了,如果采用不同的聚类方法,总是能够聚成大致相等(样本)的类,先不要高兴,可能就是不存在有差异细分市场;这就像一个球或圆,按照要求总能分割成大致相等的块一样;

    还要记住:如果市场存在着明显的细分市场,也就是差远很大的类,无论什么细节技术或聚类技术都应该得到类似的结果;难点主要是细分不明显的时候,需要依赖方法了,尝试不同的聚类方法!

     

    我记得曾经做过一个市场细分项目,因为我没有能够得到满意的细分市场,或者说无法解释清楚细分市场的独特性,客户提出一个问题:你尝试了各种聚类结果吗?当时还没有数据挖掘技术,不过因为这个要求,我把聚类过程和可能的情况有了新的认识,与大家分享:

    上面的样本,实际上存在不同的类,但粗看可能看不出来,但是如果我们采用聚类分析,就可以得到如下可能结果:

比较明显的可以看出,上面的样本在两个维度上存在着五个不同类别。

现在我们来看看聚类分析的基本思路和思考:

1)市场细分:是采用聚类分析的主要目的,主要分成监督类和非监督类,我们现在讨论的是非监督类方法,就是事先不知道是否存在细分市场,也就是事后细分;

  • 这就需要我们采用市场研究的方法收集目标市场消费者的分类变量和关键性描述信息。
  • 在收集和分析所有相关信息之前,市场细分并不确定。
  • 采用多元统计分析技术识别细分市场,并将消费者按一定的算法规则划分为不同的市场。
2)具体分成多少类:没有一个统一的答案。
  • 经验、直觉、统计结果和常识判断,所有这些都可以用来决定市场细分的个数。
  • 如果细分后存在着几个非常小的市场,需要修正分类标准,或者将原始资料中的异常值剔除掉。
  • 如果市场被划分得太细的话,将导致对一些小的、相似性的市场采用许多不同的市场营销策略。
3)数据预处理-因子分析:一般在社会科学和市场研究领域的事后细分,往往我们面对的是态度量表,也就是希望从消费者的消费行为,社会态度和价值观等层面进行细分,那么我们聚类就面临着要进行数据预处理;这里一般都会设计到因子分析。
  • 根据量表的信度和效度得到的因子应该有意义和进行因子命名,否则后面的聚类都是根据因子名称来理解的;
  • 原始变量需要进行标准化,但是因子分析后得到的因子已经是标准化变量了;
  • 一种思路直接用因子进行聚类分析,因子是正交的,得到的是“清晰”的聚类结果;但是记住:有时候更适合聚类的因子分析是采用斜交因子!所以,我们如果目标是聚类的话,要考虑斜交方法;
  • 一种思路是放弃因子,而采用原始变量,但这时候要考虑选择每个因子负荷前几个的变量,最好数量相当,否则某些变量越相关,意味着权重越大;
4)数量还是模式:得到因子后要明确是基于量的聚类还是基于模式的聚类,这个差异是非常大的;

从上面我们可以看出:基于量的聚类A和B,C和D是一类,但基于模式则A和C,B和D是一路;
记住:所以在聚类变量的标准化要考虑这一点!
5)聚类数量:一般从3-7个不断尝试,如果你用SPSS软件,建议事项保证样本是排序的;
6)类的评估:一般我们可以采用类均值的F检验,看不同类在F统计量上的差异,也就是每个类在聚类变量上的显著差异:

上面的3个类,进行方差分析,得到F统计量,我们可以看到,F值越大说明分成3类的主要差异在什么变量上;
7)测试不同的聚类结果:同上想法,我们可以尝试在4类后的情况发生什么变化,然后把3类和4类结果进行交互分析,看看3类变成4类到底在哪里发生变化,主要影响变量是什么因素影响:

8)最后,针对可能的稳定聚类,测试每个变量(最初的量表)在各个类的F统计量,看看最初的原始变量(不是因子)的影响特性;
9)把最后确定的聚类结果写入原始数据集,进行类命名;
10)采用判别分析,判别类和聚类变量的可视化,画判别图,进一步识别类的特征
11) 采用对应分析和多元对应分析,识别类的属性和关键类(细分)表述变量,比如:性别、年龄、职业、收入、消费特性等
12)采用CHAID分类决策树,自动侦测进一步识别类的特性;

记住:
  • 为了得到比较好的结果,我们一般现在都采用Two-step聚类,这样可以把定类变量纳入聚类
  • 如果希望得到稳定的聚类结果,可以在聚类分析的时候提供类中心——一般来自分类均值
  • 聚类结果得到的细分市场一定是研究者能表述并有营销手段达到目标市场的
  • 细分不光为自己找到细分市场,也为竞争对手细分了市场
最后我要说:聚类是一门技术,细分是一门艺术!