【发布时间】:2011-03-11 10:18:16
【问题描述】:
或者列出如何在 R 中执行您在 SQL 中执行的操作(反之亦然)?
谢谢,
塔尔
【问题讨论】:
-
像什么?你想做什么操作?
-
嗨 Nico,我指的是所有操作。我想看看是否有类似 R 的东西供 SQL 用户使用(就像有书 R 供 SAS 用户使用)——所以当我在 SQL/
标签: sql r comparison
或者列出如何在 R 中执行您在 SQL 中执行的操作(反之亦然)?
谢谢,
塔尔
【问题讨论】:
标签: sql r comparison
【讨论】:
您可以查看 Joshua Reich 的 presentation on R and SQL(参见第 11 页)。
【讨论】:
sqldf 包中帮助(sqldf) 页面底部的示例部分包含相当多的 SQL 命令及其 R 对应项。
【讨论】:
RMysQL 包也值得研究。
我使用在导入 R 之前无法转储为文本的非常大的数据集。这个包允许我使用 R 中的标准 mysql 查询来提取我的数据子集。
【讨论】:
我最近才开始使用 RMySQL,非常喜欢这个包。我只是在 R 本身中运行基本的 SQL 查询。大部分数据的重新排列是在几个独立的 SQL 脚本中完成的,基本上是一些存储过程。
我认为 R 是一个具有一些很好的合并功能的统计包,但它并不意味着以这种方式处理关系数据。我确实使用微数据进行了很多工作,并且必须从这些微数据中设置非关系数据集(然后使用 R 进行回归分析并绘制 ggplot2(!))。在连接到 R 之前,我还在 SQL 本身中进行数据聚合。
我还建议使用视图(如果它们对您来说足够快的话)。 R 使用 list tables 语句像普通表一样访问它们。
除了 RPostgreSQL,如果你想试试 postgreSQL。我尝试过一次但切换到 RMySQL,因为 RPostgreSQL 在我的 Mac 上很难设置,并且在更新后配置消失了。 RMySQL 要容易得多。那时我必须自己编译包,所以如果你运行另一个操作系统,你可能会得到一个二进制文件(或者现在那里有一个 Mac OS)。
无论如何,即使您使用 RMySQL,也有一些关于 RPostgreSQL 的文献可能对您有所帮助,特别是如果您打算将它用于时间序列数据(例如 TSPostgreSQL)。
【讨论】: