我在哪里可以下载免费的、富含文本的数据集？答案

【问题标题】：Where can I download a free, text-rich dataset?我在哪里可以下载免费的、富含文本的数据集？
【发布时间】：2011-02-03 01:41:14
【问题描述】：

我想为全文搜索做一些轻量级的测试和基准测试，所以数据集应该具有以下品质：

带有标题和描述字段的书籍或电影之类的内容将是完美的。我浏览了 UCI Machine Learning Repo，但它太以数字为导向。

【问题讨论】：

【解决方案1】：

使用Gutenberg Project。您可以访问数以千计的纯文本英文书籍。这就是我用过一次并且很满意的东西。

【讨论】：

【解决方案2】：

你可以试试
- CKAN
- 或search for "Open Data"

【讨论】：

【解决方案3】：

如果没有找到，可以使用 LOREM IPSUM 生成器创建一个

您还可以获得完整的 StackOverflow 数据转储

【讨论】：