【发布时间】:2012-07-06 08:20:21
【问题描述】:
我有一个数据集(其中每个数据都是带有相应类标签的属性向量)。我想将数据集拆分为训练集和测试集。无论如何可以自动执行此操作吗?
【问题讨论】:
-
你用的是什么软件?大多数数据挖掘软件都在软件中提供此功能。
-
@GordonLinoff 告诉我使用什么。我不使用任何软件,我只是用 C++ 和 Python 编程。
-
@Anony-Mousse 但是 Weka 不会为我拆分数据集。我想获取两个文件 data_train.txt 和 data_test.txt,以便以后在我的实现中使用它们。
-
哦,当然可以:weka.wikispaces.com/…
-
我建议您重新提出问题,更好地描述您要完成的工作。您似乎正在自己实施数据挖掘软件。数据库从哪里来?为什么不直接使用 C++ 将数据拆分为两个文件?
标签: database dataset data-mining cluster-analysis cross-validation