【发布时间】:2018-05-26 14:57:36
【问题描述】:
我想将我的数据集随机拆分为训练和测试数据,以便在 java 中进行朴素贝叶斯分类。我知道,我有一个使用 weka 的选项,但我不想使用外部库。我还有哪些使用 java 的可能性?
【问题讨论】:
-
你可以在java中定义你自己的随机化吗?他们需要平均分配吗?还是您希望大多数训练和一个子集用于测试?
-
我有一个约束,即保留 75% 作为训练数据和 25% 作为测试数据,除了这个没有限制。
-
我看不出你这样做有什么问题。听起来很简单,您可以详细说明您自己在哪些方面遇到困难。向我们展示您迄今为止所做的尝试。我的意思是你目前的问题很广泛。从您的全部数据中,随机选择 75% 的条目作为训练集,并将其余条目用作测试数据。
-
您需要自己进行研究。见help center,第三点……
标签: java