【发布时间】:2012-07-21 05:27:08
【问题描述】:
这是我的previous 问题的后续。
假设我并行处理我的文件。现在我想将处理结果写入文件。由于结果不适合内存,我不能等到所有文件的处理完成后再写入结果。我必须以某种方式并行进行处理和写入。
例如:假设我有带有数字的文件。文件大小约为500M。文件数约为200。每个文件都适合内存,但所有文件都不适合。现在我想将在这些文件中找到的所有 偶数 数写入另一个文件。
如何在 Scala 中做到这一点(使用 Futures 和 Scala parallel collections)?
【问题讨论】:
-
scalax.io 中的 Lines() 是懒惰评估的也看看future-exec jesseeichar.github.com/scala-io-doc/0.4.0/index.html#!/core/…
标签: file scala parallel-processing