【发布时间】:2020-11-02 19:14:53
【问题描述】:
我有一个大数据框(超过 100 000 个条目),看起来像这样:
ID Pre temp day
134 10 6 1
134 20 7 1
134 10 8 1
234 5 1 2
234 10 4 2
234 15 10 3
我想通过查找相同 ID 值的 pre、temp 和 day 的平均值来减少我的数据框。 最后,我的数据框看起来像这样
ID Pre temp day
134 13.3 7 1
234 10 5 2.3
我不知道该怎么做?
提前谢谢你!
【问题讨论】:
-
简单,可以使用
aggregate(.~ID,df,mean) -
只想添加data.table解决方案:
dt[,.SD[,.(mean(Pre), mean(temp), mean(day))], by="ID"]