【问题标题】:tidying time series data by country按国家整理时间序列数据
【发布时间】:2020-05-20 22:28:27
【问题描述】:

我有按国家/地区组织的时间序列数据,然后是我感兴趣的变量。当我偶尔有两行在年份和国家代码中对齐时,如何添加感兴趣的变量?

例如

CC  Year  IV 

2   2000  6
2   2001  8
2   2002  14
2   2003  8
2   2001  2
2   2002  5

我希望数据像这样整理

CC  Year  IV 

2   2000  6
2   2001  10
2   2002  19
2   2003  8

【问题讨论】:

  • 对不起,我不明白这个问题。好像有3个问题。 1) 哪两行在年份和国家代码中都对齐?也许您可以突出显示它们或说出文本中的哪些。 2)我只看到一个输入行,但你说你有两行。 3)当您说“希望数据像这样整理”时,其他条目是否被删除或移动到新行?

标签: r time-series tidyverse


【解决方案1】:

我想我理解您的问题,但很难从您提供数据和表述问题的方式中看出这一点。有关如何提问的一些有用资源是How do I ask a good question?How to create a Minimal, Reproducible Example

据我了解,您的数据如下所示(我添加了一些带有额外国家代码的记录):

df <- tibble(CC = c(2,2,2,2,2,2,3,3,3),
       Year = c(2000, 2001, 2002, 2003, 2001, 2002, 2000, 2001, 2000),
       IV = c(6, 8, 14, 8, 2, 5, 3, 12, 7))

听起来您想按国家和年份对列 IV 中的变量求和。 这样就可以了:

df %>% 
  group_by(CC, Year) %>%
  summarise(sum_IV = sum(IV))
# A tibble: 6 x 3
# Groups:   CC [2]
     CC  Year sum_IV
  <dbl> <dbl>  <dbl>
1     2  2000      6
2     2  2001     10
3     2  2002     19
4     2  2003      8
5     3  2000     10
6     3  2001     12

【讨论】:

  • 谢谢!正是我想要的。下次我会更好地安排我的提问。
猜你喜欢
  • 2018-05-11
  • 1970-01-01
  • 1970-01-01
  • 2016-02-14
  • 2020-07-12
  • 1970-01-01
  • 2014-09-14
  • 1970-01-01
  • 2023-03-15
相关资源
最近更新 更多