【发布时间】:2016-10-09 21:03:56
【问题描述】:
1) 我想对 Twitter 推文进行情绪分析。所以,我选择使用 datumbox-framework。我有一点疑问,我的训练样本的大小应该是多少? & 如果我正在收集正、负、中性的训练样本,我应该为所有训练样本保持相同的大小吗? (即,我是否可以收集 10 个 pos、5 个 neg、15 个中性作为我的训练集,或者我应该在我的训练集中收集并维护所有相同大小的 pos=10;neg=10;neutral=10 的 pos、neg、neutral)我用于推特情绪的算法。 是海军贝叶斯。
2) 训练数据集有大小限制吗?
【问题讨论】:
-
我能知道我的问题被否决的原因吗?
-
它可能已被否决,因为它是一个可以导致基于意见的答案的问题。
标签: twitter machine-learning nlp datumbox