品牌型号:联想ThinkBook
系统:Windows10 64位旗舰版
软件版本:IBM SPSS Statistics 29.0
在数据分析领域,如果需要对数据进行组别或者集合的分类,我们可以借助SPSS进行快速聚类分析,便于优化实验数据的形式和组合方式。本文以SPSS快速聚类分析步骤,SPSS快速聚类分析结果解读这两个问题为例,带大家了解一下SPSS快速聚类分析的知识。
一、SPSS快速聚类分析步骤
通过找到SPSS聚类的功能按键、选择迭代分类方法、设置个案标注依据、保存聚类成员等步骤,我们得到聚类中心和ANOVA表来解读聚类分析的结果。聚类成员的数值表格显示聚类成员与中心之间的距离,ANOVA表显示划分类别是否有效。
1、如下是某城市知名企业的运营项目数据,包含毛绒玩具、游戏周边、护颈仪、新能源家电、育儿平板、扫地机器人、聊天软件、导航器械、按摩椅、坐便器十个类型在市区和县域方面的销售占比情况。企业方想要依据市场占比对上述十个品类进行大类划分,由此针对性扩大生产和推广营销。

2、为了对毛绒玩具、游戏周边、护颈仪、新能源家电、育儿平板、扫地机器人、聊天软件、导航器械、按摩椅、坐便器十个项目进行快速聚类,我们选择20次迭代出3个聚类的方法模式,将年投入总额、县域市场占比、市区市场占比放入分类变量框。

3、通过快速聚类的功能设置,我们选择将毛绒玩具、游戏周边、护颈仪、新能源家电、育儿平板、扫地机器人、聊天软件、导航器械、按摩椅、坐便器十个项目的销售占比情况作为聚类成员,并且需要查看每个项目与其所划分中心的距离。

4、在聚类分析的选项界面,我们默认如果存在缺失值,整体数据将成列排除个案,然后进行个案聚类、单因素分析、初始聚类中心的统计运算。

二、SPSS快速聚类分析结果解读
聚类分析指的是找到k个簇中心,使意向数据分配到最近的簇中心,每个聚类由一个中心向量表示。通过对连续性数值分配至最近的簇中心,我们确保每个样本与其所属类的均值距离之和最小。简单来讲,快速聚类的结果主要看ANOVA的显著性分析以及聚类成员的信息表。
1、根据如下的功能指示,我们在迭代次数输入20,默认收敛准则为0,便确认了20次迭代出3个聚类的方法模式,根据迭代历史看到每次迭代过程聚类的平方和情况,如果迭代在几次之后稳定下来,表示数据模型找到相对稳定的解。

2、毛绒玩具和游戏周边划定为一类,这两个运营项目与分类中心的距离均为18.251,护颈仪、新能源家电、育儿平板、扫地机器人、聊天软件、导航器械划定为一类,这六个项目与中心的距离分别为31.01、30.621、26.023、9.399、38.839、58.106,按摩椅和坐便器划定为一类,这两个项目与中心距离均为12.159。

3、年投入总额、县域市场占比、市区市场占比这三列的显著性数值均小于0.001,表明这三方面对于毛绒玩具、游戏周边、护颈仪、新能源家电、育儿平板、扫地机器人、聊天软件、导航器械、按摩椅、坐便器十个项目的分类有着显著影响。

三、小结
以上就是SPSS快速聚类分析步骤,SPSS快速聚类分析结果解读的解答。为了优化数据集合的形式和定义,推荐使用SPSS快速聚类分析的方法。最后,也欢迎大家前往SPSS的中文网站,学习更多关于数据分析的操作技巧。