【发布时间】:2017-09-01 11:23:25
【问题描述】:
我有两个数据框
df1
time x y state
... ... ... CA
... ... ... MA
... ... ... TX
... ... ... MA
... ... ... CA
... ... ... IL
df2
time x y state
... ... ... MA
... ... ... NY
... ... ... MA
... ... ... TX
... ... ... CA
... ... ... CA
然后我有一些代码,我在其中汇总每月值、重命名列、将数据与另一个列表匹配,然后将 df1 和 df2 合并为大约 50 行代码中的一个。在这里,我目前不考虑state。
但是,我需要为美国的几个州创建合并数据框的子集。除了复制/粘贴用于 df1 和 df2 的代码并将 df1 和 df2 替换为 df1_CA、df2_MA 等之外,还有更优雅的方法吗?
循环?面板数据?
【问题讨论】:
-
有一个
look atsplit`,然后是lapply函数(或循环)。split(df1,df1$state) -
在
dplyr中使用group_by可能适合这里 -
如果您能提供一个可重现的小例子,那就太好了。很抱歉,我无法提供我的原始代码。
-
@Fanny,实际上,你的工作是提供一个小的可重现示例。