【发布时间】:2017-01-11 18:58:10
【问题描述】:
我需要为给定的数据集编写一个实现kmeans 聚类的程序(我大致了解kmeans 算法的工作原理)。由于我希望我的程序具有通用性,因此我想了解以下术语:
对于一个有 100 行 10 列的给定数据集(假设每一列都是一个特征),我如何识别以下参数:
- 维度:我怎么知道这个数据集的维度?
-
数据点:是指每个单元格
[row][col]是一个数据点还是整行都是一个数据点(点向量)?
【问题讨论】:
-
每个维度对应一个特征,一个数据点就是一行,即那个NC维空间中的一个点。
标签: machine-learning cluster-analysis data-mining computational-geometry k-means