【问题标题】:Text Mining Library for PythonPython 文本挖掘库
【发布时间】:2014-01-14 07:50:31
【问题描述】:

我必须使用 python 2.x 在 web2py 中构建一个文本挖掘应用程序。应用程序的目的是从网站收集数据并将它们保存在一个文本文件中,然后将该文本文件传递给程序进行文本到矩阵的转换,最后我必须对该数据应用聚类。

我的问题是我可以使用哪些开源库或 API 来涵盖文本到矩阵的转换并在 python 2.x 上应用集群?

【问题讨论】:

  • 你知道你要处理多少文件吗?他们会有多长时间?答案可能因数据量而异...

标签: api python-2.7 web2py text-mining


【解决方案1】:

我认为scikit-learn 应该满足您的需求。如果不确切知道您的数据会是什么样子,很难说,但 scikit-learn 的 API 中有许多文本操作函数和内置的聚类算法。

【讨论】:

    猜你喜欢
    • 2011-02-07
    • 2011-01-07
    • 2019-05-05
    • 2013-02-09
    • 2015-07-17
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多