【发布时间】:2020-06-23 16:23:03
【问题描述】:
我的数据库的基础是暴力事件。我知道这些事件发生在哪个网格单元中以及发生在哪个日期。在我的分析中,我使用某个网格单元、国家和年份中暴力事件的频率作为因变量。为了创建这个频率变量,我 collapse 我的暴力事件数据库并计算特定年份特定网格单元中的暴力事件数量。
如果某年某个网格单元中没有暴力事件,我想包含一个值 0。但是,由于我的基础是暴力事件数据库,所以当我collapse 我的数据时,我没有这些观察结果。有没有办法为没有暴力事件的年份和网格单元中的观测值创建 0 值?
在我 collapse 我的日期集之前它看起来像这样
+--------------------------+
|Country Year Grid_cell_id |
|--------------------------|
|Benin 2012 365 |
|Benin 2012 365 |
|Benin 2012 367 |
|Benin 2014 365 |
|Benin 2014 365 |
|Benin 2014 365 |
|Benin 2015 240 |
|Benin 2015 240 |
|Kenya 2012 430 |
|Kenya 2012 430 |
|Kenya 2013 467 |
|Kenya 2014 567 |
|Kenya 2014 567 |
|Kenya 2014 567 |
+--------------------------+
一旦我collapse 我的数据集,它看起来像这样:
+---------------------------------+
|Country Year Grid_cell_id freq |
|---------------------------------|
|Benin 2012 365 2 |
|Benin 2012 367 1 |
|Benin 2014 365 3 |
|Benin 2015 240 2 |
|Kenya 2012 430 2 |
|Kenya 2013 467 1 |
|Kenya 2014 567 3 |
+---------------------------------+
当我使用fillin 创建 0 频率值时,我只使用我只使用 grid-cell_id 和 year,但我还想要有关 grid-cell 所在国家/地区的信息。我可以使用fillin 函数轻松访问下面的数据集,但是如何保留国家/地区值,而不将其用作fillin 标准。
+---------------------------------+
|Country Year Grid_cell_id freq |
|---------------------------------|
|Benin 2012 365 2 |
|. 2013 365 0 |
|. 2014 365 3 |
|. 2015 365 0 |
|Benin 2012 367 1 |
|. 2012 367 0 |
|. 2013 367 0 |
|. 2014 367 0 |
|. 2015 367 0 |
+---------------------------------+
【问题讨论】: