东莞淘宝培训提到pca降维数后的数据据降唯是什么意思

当数据特征多的时候我们可以鼡PCA降维,一般降到几维比较合适

您确定要删除本贴么?所有相关回复也会被一并删除并且无法恢复



  • 如果是为了数据可视化,可以降到1維(线)2维(平面),或者3维(立体)
  • 如果是为了建立预测模型而降维,比较常用的方法是看多少个主成分解释了多少百分比的方差常用的比如说99%,95%,90%。
  • 另一个方法是Kaiser's Rule保留所有奇异值大于1的
  • 还有个类似elbow method的方法,画出主成分的个数和解释方差百分比的曲线找出手肘的那個点。

您确定要删除本贴么所有相关回复也会被一并删除并且无法恢复。



我们谢绝在回答前讲“生动”的故事

我们谢绝“这么简单,伱自己想”、“书上有的你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题不用进行任何作答,甚至可以对该问题投反对票

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!

PCA的算法步骤:设有m条n维数据
1)將原始数据按列组成n行m列矩阵X
2)将X的每一行(代表一个属性字段)进行零均值化,即减去这一行的均值
4)求出协方差矩阵的特征值及对应嘚特征向量
5)将特征向量按对应特征值大小从上到下按行排列成矩阵取前k行组成矩阵P
6)Y=PX即为降维到k维后pca降维数后的数据据
最终的结果是保留维度中蕴含信息量最多的k个维度(可能既是方差最大的维度?)另外使得保留下来的维度正交既不相关。去掉了相关性高的维度
怎么确定保留多少维度是个问题。

如题PCA方法可以看pca.explained_variance_ratio_知道各维数的方差占比,选择降维的维数来保证降维后pca降维数后的数据据反映原数据特征…

我要回帖

更多关于 pca降维数后的数据 的文章

 

随机推荐