【发布时间】:2014-03-03 03:55:36
【问题描述】:
我知道 Knn 在处理高维数据时有一个问题知道“维度灾难”,其理由是它在计算距离时包含所有特征,即欧几里德距离,其中非重要特征充当噪声并偏向结果有几件事我不明白
1) 余弦距离度量将如何受到维度灾难的影响,即我们将余弦距离定义为 cosDistance = 1- cosSimilarity,其中 cosSimilarity 有利于高维数据,那么余弦距离如何受到维度灾难的影响?
2) 我们可以为 weka 中的特征分配任何权重,或者我可以将特征选择本地应用到 KNN 吗? Local to knn 意味着我编写自己的 K-NN 类,在分类中我首先将训练实例转换为低维,然后计算测试实例邻居?
【问题讨论】:
标签: machine-learning weka knn text-classification