【发布时间】:2016-07-20 08:56:52
【问题描述】:
我有一个名为 df 的数据框:
City,State,Price,Dogs
Portland,OR,75,1
Portland,OR,100,3
San Diego,CA,12,4
San Diego,CA,23,5
...
我使用了dplyr 的summarise 和group_by 函数...
df.median <- summarise(
group_by(
df,
State,
City
),
MEDIAN_PRICE = median(Price),
SUM_DOGS = sum(Dogs)
)
但是当我运行top_n(df.median, 100, SUM_DOGS) 时,R 不会给我在SUM_DOGS 中具有 100 个最高值的城市。它只返回df.median。
为什么?
【问题讨论】:
-
返回什么?
-
@MekkiMacAulay 编辑答案
-
如果您不希望每个
State的前 100 个值,您可能需要ungroup。 -
@aosmith 如果我想要
df.median的前100 名,我该如何使用ungroup来实现呢?