【发布时间】:2020-04-17 01:40:18
【问题描述】:
我正在处理大小为 (500, 33) 的数据集。
特别是数据集包含9个特征
[X_High, X_medium, X_low, Y_High, Y_medium, Y_low, Z_High, Z_medium, Z_low]
在视觉上和相关矩阵计算后我观察到
[X_High, Y_High, Z_High] & [ X_medium, Y_medium, Z_medium ] & [X_low, Y_low, Z_low] 高度相关(85% 以上)。
我想执行聚类算法(比如 K 均值或 GMM 或 DBSCAN)。
在这种情况下,
是否有必要去除无监督学习的相关特征? 删除相关性或修改功能是否会产生任何影响?
【问题讨论】:
标签: python machine-learning correlation unsupervised-learning feature-engineering