【发布时间】:2021-06-02 16:14:33
【问题描述】:
我正在处理公司数据集,并试图了解它们何时关闭
所以我的数据集是这样的:
Year ID Open
2014 a1 Y
2015 a1 Y
2016 a1 Y
2017 a1 Y
2014 a2 Y
2015 a2 N
2016 a2 N
2017 a2 N
2014 a3 Y
2015 a3 N
2016 a3 Y
2017 a3 N
我想制作3个条件变量
如果它在 2014 年开业并在 2015 年关闭,则为 1,否则为 0 如果它在 2014 年开业并在 2016 年关闭,则为 1,否则为 0 如果它在 2014 年开业并在 2017 年关闭,则为 1,否则为 0
所以我想要的数据集是这样的:
Year ID Open C15 C16 C17
2014 a1 Y - - -
2015 a1 Y 0 0 0
2016 a1 Y 0 0 0
2017 a1 Y 0 0 0 #Because firm never closed
2014 a2 Y - - -
2015 a2 N 1 0 0 #Firm def. closed in 2015
2016 a2 N 0 1 0 #Still closed
2017 a2 N 0 0 1 #Still closed
2014 a3 Y - - -
2015 a3 N 1 0 0 #Firm closed this year
2016 a3 Y 0 0 0 #Firm is open again
2017 a3 N 0 0 1 #Firm closed again
数据框按 ID 分组,但我不知道如何以 2014 年为条件
【问题讨论】:
标签: r dataframe if-statement dplyr tidyverse