【发布时间】:2019-12-01 14:05:06
【问题描述】:
我想用一个非常大的文件(超过 1GB)测试基于 MapReduce 框架的 wordcount 软件,但我不知道如何生成它。
是否有任何工具可以创建包含随机但合理的英语句子的大文件? 谢谢
【问题讨论】:
-
古腾堡计划? gutenberg.org
-
谢谢,但我发现只有小型电子书,大的或多或少 1MB。我需要一个 1GB 以上的文件
标签: bigdata large-data large-files large-data-volumes