【发布时间】:2011-12-15 02:13:55
【问题描述】:
我的大部分统计分析都使用 R。但是,清理/处理数据,尤其是在处理 1Gb+ 的大小时,非常麻烦。所以我为此使用了常用的 UNIX 工具。但我的问题是,是否有可能在 R 会话中间以交互方式运行它们?一个例子:假设file1 是来自 R 进程的输出数据集,有 100 行。由此,对于我的下一个 R 流程,我需要第 1 列和第 2 列的特定子集 file2,可以通过 cut 和 awk. 轻松提取因此工作流程类似于:
Some R process => file1
cut --fields=1,2 <file1 | awk something something >file2
Next R process using file2
如果这是一个愚蠢的问题,请提前道歉。
【问题讨论】:
-
请参阅
?system,了解如何在 R 中运行 shell 命令。 -
@Joshua:在我看来,将此作为答案发布会是更好的做法。这将导致 [r] 问题的显示有一个非零答案并允许它被接受。
-
也许吧。发布一个超简短的答案或我没有详细解释的答案,我总是感到有点内疚,所以我把它作为评论留下,让其他人(或 OP)重新发布更多细节作为答案.. .