【问题标题】:what is score in princompprincomp 中的分数是多少
【发布时间】:2012-05-01 15:45:52
【问题描述】:

我有一个包含功能的 CSV 文件。行代表对象,列代表特征。我像这样阅读 CSV 文件

O = csvread('data');

现在我做了一个

[COEFF,SCORE] = princomp(O)

我在 O 上进行 princomp 的目标是执行降维,因为特征数量太大。现在,在此操作之后,SCORE 向量是否保留了降维特征集,还是我必须执行更多操作才能获得它?

【问题讨论】:

    标签: matlab pca


    【解决方案1】:

    来自the documentation

    [COEFF,SCORE] = princomp(X) 返回 SCORE,主成分分数;也就是 X 在主成分空间中的表示。 SCORE 的行对应观察值,列对应分量。

    【讨论】:

    • 所以分数向量是我必须输入到分类器的数据向量吗?
    • 没错,就是这个变换空间中的数据向量。
    • 如果在这种情况下输入向量 = O 包含 9 列,我知道 SCORE 向量的列显着性会随着您从左到右而降低,但不知道如何确定其中有多少使用。
    • 如果您采用第三个返回变量latent,则显示每列占的方差; cumsum(latent) ./ sum(latent) 为您提供百分比。选择一个k,在没有太多特征和覆盖大量差异之间取得最佳平衡;然后只取每个向量的第一个 k 分量。 (要转换测试数据,只需对coeff 进行适当的切片。)我上面链接到的文档有这样的例子。
    • 我在执行 cumsum(latent)./sum(latent) 0.9937 0.9973 0.9988 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 后得到了这些结果,如果我需要 98% 的方差,我需要选择前三列吗?
    猜你喜欢
    • 2013-05-28
    • 1970-01-01
    • 2021-02-25
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2020-03-07
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多