基本流程
1.检验数据是否适合做主成分分析/是否需要主成分
- 本质:数据之间相关性较高则适合做主成分分析
- 检验方法:
- KMO系数法
KMO()
括号内填相关矩阵
KMO系数 > 0.7,则认为适合做主成分(0.7 并不是严格规定,实际操作中 0.6 这样也不是不行) - barlett球形检验
cortest.bartlett()
括号内填相关矩阵
$ p 一般来说,主要看bartlett球形检验
2.主成分提取
根据相关矩阵的特征根(的平方根)大小进行权重分配
princomp(X<原始样本>, cor = T) -> X<!--原始样本-->
summary(X, loading = T)
样本信息保留 80%, 85%, 90% 可做主成分(比较主观)
实例
我们有 "工业数据.csv" 文件(如下图),文件内包含不同工业部门行业指标信息,对此进行主成分分析.