【发布时间】:2018-03-02 10:57:31
【问题描述】:
我使用三个变量运行 Spark (2.2) PCA:x、y 和 z。 我明白了:
+-----------------------------------------------------------+
|pcaFeatures |
+-----------------------------------------------------------+
|[4192.998527751072,7.815744760976605,2.064076348440629] |
|[934.9987857492071,6.178849121007534,2.0229856767680876] |
|[81.99880210954893,6.012098465539804,2.0127405793319535] ...
所以这些是特征向量。它们是否按顺序对应于 x、y 和 z?如果 PCA 是关于减少特征,那么我可以说 x 解释了大部分数据,所以只使用 x 吗?由于我有一个值向量,我可以用数学方法将其表示为百分比吗?
【问题讨论】:
标签: apache-spark pca