【发布时间】:2015-06-26 08:11:43
【问题描述】:
我现在正在阅读一本关于机器学习的书。
在NaiveBayesClassifier 上工作,作者非常赞成交叉验证方法。
他建议将数据分成十个桶(文件),并在每次保留不同的桶时对其中的九个进行训练。
到目前为止,我唯一熟悉的方法是将数据以 50%/50% 的比例分成训练集和测试集,然后简单地一次性训练分类器。
有人能解释一下使用交叉验证有哪些可能的优势吗?
【问题讨论】:
-
我投票结束这个问题,因为这是一个机器学习理论问题,而不是软件开发问题。
标签: statistics classification cross-validation naivebayes