SPSS中因子分析的操作过程和结果解读笔者在做该项研究时在网络上查阅了大量资料,都写得比较专业,所以该篇文章将因子分析从前到后做一个通俗易懂的解释,全文并不涉及非常晦涩的公式原理。
一)什么是因子分析;一)因子分析)在因子分析模型中,假设各原始变量由共同因子和唯一因子两部分组成。共同因子是各原始变量共有的因子,说明变量之间的相关关系。唯一因子wgdzt是每个原始变量的固有因子,显示该变量不能用公共因子解释的部分。
(辅助解读:举个例子,目前一个表中有10个变量,因子分析可以通过某个算法将这10个变量转化为3个、4个、5个等因子,每个因子代表一个意义
2 .因子分析与主成分分析的区别:主成分分析是寻找原变量的线性组合。 该线性组合的方差越大,该组合所具有的信息越多。 也就是说,主成分分析是指扩大原始数据的主成分。
因子分析,它假设原始变量背后有一个个隐藏因子,该因子可以包括原始变量中的一个或几个,因子分析不是原始变量的线性组合。
(帮助解读)主成分分析;强调降维变量中起主导作用的变量;因子分析;(寻找能够概括变量背后变量特征的因子) ) ) ) ) ) ) ) ) ) )。
————–算法和原理不介绍,秃顶—– –
2 .因素分析怎么办(用spss )1.数据准备)下图数据为某城市空气质量数据,共有6个变量,分别为二氧化硫、二氧化氮、可吸入颗粒物、一氧化碳、臭氧、颗粒物。 在SPSS中打开的数据如下:
2 .操作步骤:1)打开因子分析工具:
2 )选择进行因子分析的变量:
3 )设置因子分析模型()可以按照以下截图设置模型,一般情况下是足够的)a.描述)现在我们来谈谈KMO和Bartlett球形度检测。
KMO检验统计量是比较变量间简单相关系数和偏相关系数的指标。 主要应用于多元统计的因子分析。 KMO统计量取0和1之间的值。 Kaiser给出了常用的kmo测量标准: 0.9以上,表明非常合适; 0.8表示符合; 0.7表示一般; 0.6表示不太合适0.5以下表示非常不合适。 KMO统计量取0和1之间的值。 当所有变量之间的简单相关系数平方和远大于偏相关系数平方和时,KMO值越接近1,变量之间的相关越强,意味着原始变量越适合因子分析;当所有变量之间的简单相关系数的平方和接近0时,KMO值接近0.kmo值
bartlett’s球形检验用于检验相关数组中各变量之间的相关性、单位数组,即各变量是否各自独立。 变量之间独立的话,就不能从中提取共同因子,也不能应用因子分析法。 Bartlett球形检测认为,如果相关序列为单位序列,则各变量独立,因子分析法无效。 SPSS检测结果显示Sig.0.05 (即p值0.05 ),各变量之间相关,表明因子分析有效。
b.抽取:一般方法选择主成分法,但在用python进行因子分析时不是这种方法。c.旋转:旋转的作用是最后方便查看哪些变量属于哪个因子。 http://www.Sina.com//http://www.Sina.com /
完成此模型的设置后,可以单击“确定”在SPSS窗口中查看分析结果。
三、因子分析结果解读:主要看以下部分的结果。
1.KMO和Bartlett检测结果:首先KMO值为0.733,大于阈值0.5,表明变量之间存在相关性,满足要求; 还有Bartlett球形检查的结果。 在此只需查看Sig .项,其值为0.000,因此小于0.05。 也就是说,这个数据可以进行因子分析。
2 )公因子方差)公因子方差表示的意思是,各变量可以用公因子表示,但公因子能表示多少? 其表现的大小是公因子方差表的“抽取”。 “抽取”值越大,表示变量可以用公式因子表示,一般可以表示为大于0.5,但大于0.7则更合理,表示可以用公式因子表示。 在这个例子中,“提取”的值都大于0.7,所以变量可以很好地表示。
3 .解释总方差和碎石图:简单说明,解释地总方差可以看出因子对变量解释的贡献率(可以理解变量表达为100%需要多少因子)。 此表只需查看图中的红框列,即可显示贡献率。 蓝框通过表示4个因子,可以将变量表达到91.151%。 说明表现很好。 我认为一般要表达到90%以上,否则必须调整因子数据。 从碎石图来看,确实在4个因子之后折线变缓了。
4.旋转成分矩阵:
这一张表是用来看哪些变量可以包含在哪些因子里,一列一列地看:第一列,最大的值为0.917和0.772,分别对应的是细颗粒物和可吸入颗粒物,因此我们可以把因子归结为颗粒物。第二列,最大值为0.95对应着二氧化硫,因此我们可以把因子归结为硫化物。第三列,最大值为0.962,对应着臭氧,因此可以把因子归结为臭氧。第四列,最大值为0.754和0.571,分别对应着二氧化氮和一氧化碳,因子归结为什么这个我也不清楚,可能要请教一下环工环科的同学们,此处我选择滑稽…
四.总结:
因子分析还是非常好用的一种降维方式的,在SPSS中进行操作十分简单方便,结果一目了然。喜好机器学习的同学们自然也知道,这么好的方法怎么能少得了python呢,没错python也可以做因子分析,代码量也并不是很大,但是,python做因子分析时会有一些功能需要自己根据算法写(头皮发麻),比如说KMO检验。喜欢本文的话请点赞或留言哦,接下来还会有一些数据分析和机器学习方面的知识与大家分享~
极速赛车7码口诀果:首先KMO值为0.733,大于阈值0.5,表明变量之间存在相关性,满足要求; 还有Bartlett球形检查的结果。 在此只需查看Sig .项,其值为0.000,因此小于0.05。 也就是说,这个数据可以进行因子分析。
2 )公因子方差)公因子方差表示的意思是,各变量可以用公因子表示,但公因子能表示多少? 其表现的大小是公因子方差表的“抽取”。 “抽取”值越大,表示变量可以用公式因子表示,一般可以表示为大于0.5,但大于0.7则更合理,表示可以用公式因子表示。 在这个例子中,“提取”的值都大于0.7,所以变量可以很好地表示。
3 .解释总方差和碎石图:简单说明,解释地总方差可以看出因子对变量解释的贡献率(可以理解变量表达为100%需要多少因子)。 此表只需查看图中的红框列,即可显示贡献率。 蓝框通过表示4个因子,可以将变量表达到91.151%。 说明表现很好。 我认为一般要表达到90%以上,否则必须调整因子数据。 从碎石图来看,确实在4个因子之后折线变缓了。
4.旋转成分矩阵:
这一张表是用来看哪些变量可以包含在哪些因子里,一列一列地看:第一列,最大的值为0.917和0.772,分别对应的是细颗粒物和可吸入颗粒物,因此我们可以把因子归结为颗粒物。第二列,最大值为0.95对应着二氧化硫,因此我们可以把因子归结为硫化物。第三列,最大值为0.962,对应着臭氧,因此可以把因子归结为臭氧。第四列,最大值为0.754和0.571,分别对应着二氧化氮和一氧化碳,因子归结为什么这个我也不清楚,可能要请教一下环工环科的同学们,此处我选择滑稽…
四.总结:
因子分析还是非常好用的一种降维方式的,在SPSS中进行操作十分简单方便,结果一目了然。喜好机器学习的同学们自然也知道,这么好的方法怎么能少得了python呢,没错python也可以做因子分析,代码量也并不是很大,但是,python做因子分析时会有一些功能需要自己根据算法写(头皮发麻),比如说KMO检验。喜欢本文的话请点赞或留言哦,接下来还会有一些数据分析和机器学习方面的知识与大家分享~