品牌型号:联想ThinkBook
系统:windows10 64位旗舰版
软件版本:IBM SPSS Statistics 29.0.2.0
SPSS作为一款优秀的数据统计分析软件,除了可以对数据进行统计分析,还可以对数据建立模型,通过建立的模型全方面了解变量数据,以便于做出更好的决策,随机森林就是其中典型的数据模型之一。下面给大家详细讲解SPSS随机森林怎么做的,SPSS随机森林怎么筛选变量。
一、SPSS随机森林怎么做的
在SPSS中,随机森林数据模型就是将多个【树】模型组合在一起,而创建【树】模型,需要应用到SPSS的决策树功能,也就是说随机森林是多个决策树的集成模型,所以想要创建随机森林模型,需要先创建决策树模型,下面给大家介绍如何创建决策树。
1、启动SPSS软件,在菜单栏依次点击【文件】-【导入数据】-【Excel】,将数据集导入到SPSS中。

2、在【分析】菜单栏中,点击【分类】下的【决策树】选项。

3、在弹出的【决策树】提示框中,如果模型变量已经定义完成,点击【确定】按钮,如果模型变量没有定义,点击【定义变量属性】对变量属性进行定义。

4、在【决策树】窗口,将变量分别移动到【因变量】和【自变量】中,生长法选择【CHAID】,点击【确定】按钮。

5、完成以上操作,决策树模型就创建完成了,如下图所示。

第一个决策树完成后,接下来只需要对数据继续进行随机决策树操作,就可以得到由决策树组合成的随机森林。
二、SPSS随机森林怎么筛选变量
SPSS随机森林在数据变量的筛选上是有一定原则性的,并不是一味的随机选择变量,接下来给大家详细介绍。
1、SPSS随机森林在选择变量的时候,会根据变量对正态数据集的贡献程度进行变量的筛选,而判断变量贡献程度的标准是根据基尼系数进行判定,获取到每个变量特征的得分,以此判断贡献程度。
2、SPSS随机森林在筛选变量的时候,还会根据数据集设置一个合适的变量阈值,高于该阈值的变量会进行保留,参与随机森林模型创建。
3、除了随机森林在运行的时候自动对变量进行筛选,统计分析人员也可以通过图表手动对变量进行筛选,比如可以通过对数据集绘制直方图,明确重要变量,在进行随机森林模型建立的时候,就可以手动干预变量筛选。

总结:以上就是SPSS随机森林怎么做的,SPSS随机森林怎么筛选变量的全部内容。在数据统计分析中,随机森林模型是很实用的一种决策预估工具,可以帮助统计分析人员更好的解决分类问题、回归问题等,通过上文希望能帮助到有需要的小伙伴。