我们取educ、salary、salbegin、jobtime、prevexp来进行主成分分析,首先要对数据进行标准化处理,这样才能较好的比较:点击分析-------描述统计-----描述在对话框中选入要筛选的变量,然后选择将标准化值另存为变量这样数
我们取educ、salary、salbegin、jobtime、prevexp来进行主成分分析,首先要对数据进行标准化处理,这样才能较好的比较:
点击分析-------描述统计-----描述
在对话框中选入要筛选的变量,然后选择将标准化值另存为变量
这样数据的标准化就完成了,我们得到了5个标准化数据
将数据标准化完成后就可以进行正式分析了
点击分析----降维----因子
把需要的数据选入,描述部分选择KMO和巴特利球形检验
在提取部分选择碎石图
旋转部分选择载荷图
得分部分选择:保存为变量
最后按确定得出结果,KMO和巴特利球形检验部分值要大于0.5才能进行主成分分析
公因子方差部分表示了它的共同度,SPSS提取特征根大于1的变量的信息,可以看到除了教育部分,其他都提取原始变量差不多90%的信息
PCA目的/作用
主成分分析算法(PCA)是最常用的线性降维方法,它的目标是通过某种线性投影,将高维的数据映射到低维的空间中,并期望在所投影的维度上数据的信息量最大(方差最大),以此使用较少的数据维度,同时保留住较多的原数据点的特性。
PCA降维的目的,就是为了在尽量保证“信息量不丢失”的情况下,对原始特征进行降维,也就是尽可能将原始特征往具有最大投影信息量的维度上进行投影。将原特征投影到这些维度上,使降维后信息量损失最小。
特别提醒:
1.如果主成分分析中有n个变量,则特征值(或方差)之和就等于n。
2.特征向量(或主成分的系数)中各个数值的平方和等于1,否则就不是特征向量,也不是主成分系数。
3.步骤3.4中的主成分载荷向量各系数的平方和等于其对应的主成分的方差
4.SPSS没有专门的主成分分析模块,是在因子分析模块进行的。它只输出主成
分载荷矩阵和因子得分值,而我们最想得到的主成分的系数(特征向量)和主成分得分则需要另外计算。
5.如果计算没有错误,因子1、因子2、主成分1、主成分2和综合得分Y,它们各自的数值之和都等于0。
6.主成分分析应该计算出综合得分并排序。
声明:本文图片、文字、视频等内容来源于互联网,本站无法甄别其准确性,建议谨慎参考,本站不对您因参考本文所带来的任何后果负责!本站尊重并保护知识产权,本文版权归原作者所有,根据《信息网络传播权保护条例》,如果我们转载内容侵犯了您的权利,请及时与我们联系,我们会做删除处理,谢谢。