【发布时间】:2017-06-21 15:21:18
【问题描述】:
我正在尝试在我的数据集上运行聚类算法。我的数据集是一组数据包(源 IP、目标、端口、类标签)。我想将这些数据从名义数据转换为数值数据。转换这些数据的正确技术是什么?
【问题讨论】:
标签: dataset cluster-analysis numeric
我正在尝试在我的数据集上运行聚类算法。我的数据集是一组数据包(源 IP、目标、端口、类标签)。我想将这些数据从名义数据转换为数值数据。转换这些数据的正确技术是什么?
【问题讨论】:
标签: dataset cluster-analysis numeric
通常的方法是执行一次热编码。虽然这显然是以数字方式对数据进行编码,但它带来了几个问题。
【讨论】: