【发布时间】:2018-01-31 02:40:43
【问题描述】:
我有一个名为“yield”的数据集:
yield <- data.frame(fruits = c("apples", "apples", "apples", "oranges", "oranges",
"oranges", "pears", "pears", "pears"), year = rep(2008:2010, 3),
count = c(10, 13, 7, 5, 12, 14, 16, 18, 20))
我想确定 2008 年到 2010 年之间变化率最大的水果。我得到的最接近的是:
diff(yield$count)/yield[-nrow(yield),] * 100
但它不仅影响我的fruits 和year 列,结果也不正确。
【问题讨论】:
-
请将数据发布为纯文本而非图像,以便用户轻松复制/粘贴。
-
变化率的公式是什么?
-
(本年数-上年数)/上年数*100
-
您的公式是正确的当且仅当您还按水果分组。
-
谢谢,我考虑过使用 dplyr 函数 group_by 但不知道如何使其工作
标签: r statistics