【发布时间】:2017-06-16 12:26:34
【问题描述】:
我有如下数据框
每个 HH 在列中恰好重复 3 次。我有数百万条这样的总记录
我想将每个 HH 值的数据汇总到一行中,并删除该 HH 的剩余两行。
对于 A 列 - 每个 HH 的值采用模式,将其放在一行中。 对于每个 HH 的值的 B 列取模式,将其放在一行中。 对于 C 列 - 取每个 HH 的值的平均值,将其放在一行中。 对于 D 列 - 每个 HH 的值采用模式,将其放在一行中。
我需要对我的数据框中以千为单位的所有 HH 值执行此操作。
输出:
谢谢
【问题讨论】:
-
查看
dplyr包。该包中有一个group_by函数。此外,您应该在发布问题时创建一个可重现的示例。 -
谢谢阿卡什。我一定会检查 dplyr。我现在添加了我的问题和输出的屏幕截图。这将清楚地给出关于问题的想法。是我的问题有点搞砸了:)
-
欢迎来到 SO。请查看here,了解如何创建可重现的示例。您应该避免将您的代码或数据包含为图像,因为这意味着人们需要重新输入所有内容。 (您的链接也不起作用)
标签: r dataframe data.table