【发布时间】:2018-12-17 13:52:18
【问题描述】:
我正在改进流程,将在 r 中使用 SQL 来处理大型数据集。目前,源数据存储在几个不同的 MS Access 数据库中。我最初的方法是使用 RODBC 将所有源数据读入 r,然后根据需要使用 sqldf() 汇总数据。不过,在我开始使用 sqldf() 之前,我的 RAM 已经用完了。
我有没有更有效的方法来使用 r 完成这项任务?我一直在寻找一种方法来运行一个 SQL 查询来连接单独的数据库之前将它们读入 r,但到目前为止我还没有找到任何支持此功能的包。
【问题讨论】:
-
dbplyr允许您在 R 中收集输出之前对数据连接/数据库执行多项操作。
标签: r dplyr data.table sqldf rmysql