【发布时间】:2018-03-03 14:46:44
【问题描述】:
我想比较在遵循 PCA 和 LDA 的数据集上运行逻辑回归的准确性。我使用的数据集是威斯康星州癌症数据集,它包含两类:恶性或良性肿瘤和 30 个特征。我已经对这些数据进行了 PCA,并且能够通过 10 个 PCA 获得良好的准确度分数。我知道 LDA 类似于 PCA。我的理解是,您计算每个类的每个特征的平均向量,计算散点矩阵,然后获取数据集的特征值。 LDA 是否类似于 PCA,因为我可以选择 10 个 LDA 特征值来更好地分离我的数据?我已经用 scikit learn 尝试了 LDA,但是它只给了我一个 LDA。这是因为我只有 2 个课程,还是我需要做一个额外的步骤?我想要 10 个 LDA,以便将其与我的 10 个 PCA 进行比较。这甚至可能吗?
【问题讨论】:
-
更适合交叉验证。不涉及任何编程。更多理论
标签: machine-learning pca