按国家整理时间序列数据

【问题标题】：tidying time series data by country按国家整理时间序列数据
【发布时间】：2020-05-20 22:28:27
【问题描述】：

我有按国家/地区组织的时间序列数据，然后是我感兴趣的变量。当我偶尔有两行在年份和国家代码中对齐时，如何添加感兴趣的变量？

例如

CC  Year  IV 

2   2000  6
2   2001  8
2   2002  14
2   2003  8
2   2001  2
2   2002  5

我希望数据像这样整理

CC  Year  IV 

2   2000  6
2   2001  10
2   2002  19
2   2003  8

【问题讨论】：

对不起，我不明白这个问题。好像有3个问题。 1) 哪两行在年份和国家代码中都对齐？也许您可以突出显示它们或说出文本中的哪些。 2）我只看到一个输入行，但你说你有两行。 3）当您说“希望数据像这样整理”时，其他条目是否被删除或移动到新行？

标签： r time-series tidyverse

【解决方案1】：

我想我理解您的问题，但很难从您提供数据和表述问题的方式中看出这一点。有关如何提问的一些有用资源是How do I ask a good question? 和How to create a Minimal, Reproducible Example。

据我了解，您的数据如下所示（我添加了一些带有额外国家代码的记录）：

df <- tibble(CC = c(2,2,2,2,2,2,3,3,3),
       Year = c(2000, 2001, 2002, 2003, 2001, 2002, 2000, 2001, 2000),
       IV = c(6, 8, 14, 8, 2, 5, 3, 12, 7))

听起来您想按国家和年份对列 IV 中的变量求和。这样就可以了：

df %>% 
  group_by(CC, Year) %>%
  summarise(sum_IV = sum(IV))

# A tibble: 6 x 3
# Groups:   CC [2]
     CC  Year sum_IV
  <dbl> <dbl>  <dbl>
1     2  2000      6
2     2  2001     10
3     2  2002     19
4     2  2003      8
5     3  2000     10
6     3  2001     12

【讨论】：

谢谢！正是我想要的。下次我会更好地安排我的提问。