主成分分析—基于R

Python76

基本流程

1.检验数据是否适合做主成分分析/是否需要主成分

  • 本质:数据之间相关性较高则适合做主成分分析
  • 检验方法:
  • KMO系数法
    KMO() 括号内填相关矩阵
    KMO系数 > 0.7,则认为适合做主成分(0.7 并不是严格规定,实际操作中 0.6 这样也不是不行)
  • barlett球形检验
    cortest.bartlett() 括号内填相关矩阵
    $ p 一般来说,主要看bartlett球形检验

2.主成分提取
根据相关矩阵的特征根(的平方根)大小进行权重分配
princomp(X<原始样本>, cor = T) -> X<!--原始样本-->
summary(X, loading = T)
样本信息保留 80%, 85%, 90% 可做主成分(比较主观)

实例

我们有 "工业数据.csv" 文件(如下图),文件内包含不同工业部门行业指标信息,对此进行主成分分析.

主成分分析—基于R

输入验证码查看隐藏内容

扫描二维码关注本站微信公众号 Johngo学长
或者在微信里搜索 Johngo学长
回复 svip 获取验证码
wechat Johngo学长