【发布时间】:2014-01-14 07:50:31
【问题描述】:
我必须使用 python 2.x 在 web2py 中构建一个文本挖掘应用程序。应用程序的目的是从网站收集数据并将它们保存在一个文本文件中,然后将该文本文件传递给程序进行文本到矩阵的转换,最后我必须对该数据应用聚类。
我的问题是我可以使用哪些开源库或 API 来涵盖文本到矩阵的转换并在 python 2.x 上应用集群?
【问题讨论】:
-
你知道你要处理多少文件吗?他们会有多长时间?答案可能因数据量而异...
标签: api python-2.7 web2py text-mining