品牌型号:联想Think Book
系统:Windows10 64位旗舰版
软件版本:IBM SPSS Statistics 29.0
SPSS包含多种数据对比的方法路径,往往由于采集数据的属性各异,对应着不同的操作逻辑,而卡方检验则是针对双向无序的数据资料进行两两对比。本文以SPSS卡方检验是指什么,SPSS卡方检验列联表创建与期望值计算方法这两个问题为例,带大家了解一下SPSS卡方检验的知识。
SPSS卡方检验是指什么
正如独立样本T检验的分类变量必须是短字符,每一种数据检验方法都有其特长优势以及应用局限,而作为本文主题的卡方检验则是针对非正态分布数据的常用分析路径,能够对两个分类变量进行关联分析,比如不同地域的饮食偏好。
1、下图是某服装快消品牌对一线城市人群线下购物的问卷调查,品牌运营官想要了解线下购物的性别划分情况,进而调整实体连锁店的营销策略,并且针对性地制定服装款式和类型。

2、卡方检验通过描述统计的交叉表功能来实现。因为运营者想要先查看关于“过去一年,您是否经常在空闲时间进行逛街购物”问题的性别划分情况,所以把性别放在行的位置,问卷题项放在列的位置,使列联表的结果显示更加清晰易读。

3、接下来在交叉表的界面点击统计按键,选择卡方的应用模式,卡方检验可以计算案例数据的实际观测值与理论推断值之间的偏离程度,卡方值越大,二者偏差程度越大,如果实际数值完全符合SPSS计算的预期值,卡方值将会是0。

4、在单元格显示的功能界面,我们在【计数】模块选择【实测】和【期望】两种情况,位于行的性别和位于列的问卷题项也都查看百分比的数值,具体而言,便是多少女性选择了几乎每天都逛街购物,在回答问卷的受访者中占比情况又是怎样的。

二、SPSS卡方检验列联表创建与期望值计算方法
有关频率的问卷题项通常会设置五道及以上的选项,这样做可以给予填写者更多的选择空间,也有助于问卷信度的优化。针对包含了多个选项的一个问卷题目,如果想要了解多少人选择了A,又有多少人选择了D,而选择者的年龄、性别、收入情况又是怎样的,就需要创建卡方列联表。另外,偏差程度的计算能够进一步了解问卷题项的组间差异。
1、每天都会线下购物作为逛街购物的最高频率选项,以这个选项为例,我们看看该一线城市线下购物的具体情况,在受访者中,有230位男性和366位女性表示每天都会逛街购物,这和SPSS预期的278位男性以及317位女性相差较多。

2、某一线城市的逛街购物频率和性别是否有明显的关系呢?这需要依托卡方检验的显著性,那么以哪个统计逻辑的显著性数值为准呢?本文列联表的最小期望计数在1到5的范围,以似然比后续数据为准,后续两排渐近显著性都小于0.001,表示该一线城市的男性和女性在逛街购物频率上存在显著差异。

3、在上述列联表的功能设置中,我们选择显示条形图来理解逛街购物频率与性别的关联,天蓝、墨绿、暗红、亮橙、深棕、浅绿、深蓝对应每天、一周数次、一月数次、一年数次或更少、从不、不知道、拒绝回答这些选项,而且男性和女性人数也是以对应颜色进行标注。

三、小结
以上SPSS卡方检验是指什么,SPSS卡方检验列联表创建与期望值计算方法的解答。如果想对非正态分布数据进行关联分析,推荐使用SPSS卡方检验来建立列联表。最后,也欢迎大家前往SPSS的中文网站,学习更多关于数据分析的操作技巧。