【发布时间】:2013-03-17 02:37:13
【问题描述】:
如何将 R 包 zoo 或 xts 用于非常大的数据集? (100GB) 我知道有一些包,例如 bigrf、ff、bigmemory 可以处理这个问题,但是你必须使用它们有限的命令集,它们没有 zoo 或 xts 的功能,我不知道如何制作zoo 或 xts 使用它们。 我该如何使用它?
我看到还有其他一些与数据库相关的东西,例如 sqldf 和 hadoopstreaming、RHadoop 或 Revolution R 使用的其他东西。您有什么建议?还有其他的吗?
我只想聚合系列、清理并执行一些协整和绘图。 我不希望每次都使用少量数据为我需要的每个命令编写代码和实现新功能。
补充:我在 Windows 上
【问题讨论】:
-
这不是一个量化金融问题。我将其发送到 Stack Overflow。
-
@skan 你可以看看由 Jeff Ryan(xts 的作者)创建的
mmap包 -
但我在 Windows 上使用 R,而 nmap 在 Linux 上工作。那么你认为我不能将 ff、revoscaler 或 RHipe 等软件包与 zoo 一起使用或执行协整或小波分析?
-
mmap 包在 unix-alikes 上使用
mmap,在 Windows 上使用MapViewOfFile。你不需要知道任何这些来使用这个包,这就是为什么我问你是否真的看过(即尝试过)这个包。有一个带有示例的小插曲,Jeff 有几个演示文稿在网上流传。
标签: r time-series xts zoo