【问题标题】:How much text can Weka handle?Weka 可以处理多少文本?
【发布时间】:2014-11-16 17:17:16
【问题描述】:

我有一个情绪分析任务,我需要指定 weka 可以处理多少数据(在我的例子中是文本)。我已经标记了 2500 个意见的语料库。我知道这是一个很小的语料库,但我的论文导师要求我专门讨论 Weka 可以处理多少数据。

【问题讨论】:

    标签: machine-learning nlp weka sentiment-analysis document-classification


    【解决方案1】:

    您对 Weka 的限制将取决于您使用的任何学习算法以及您有多少内存可用于训练。大多数分类器需要将整个集合加载到内存中进行训练,但也有流数据的选项。请参阅the weka page on big data 了解更多信息。

    对于像您这样小的数据集,您不会有任何问题。但是,对于任何大数据问题,您都无法再仅在一台机器上编写脚本。 Weka 没有什么不同,一旦你到达那里,就有办法让它发挥作用。据我所知,只要有足够的硬件资源、时间和独创性,您能够处理的数据量没有硬性限制。

    【讨论】:

      猜你喜欢
      • 2014-11-17
      • 1970-01-01
      • 2014-10-25
      • 2015-03-21
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2013-04-25
      相关资源
      最近更新 更多