【发布时间】:2019-09-26 19:26:16
【问题描述】:
我想将下面显示的数据转换为邻接矩阵,以便将其用于网络分析。
变量如下:
-
ccode1: 国家 1 的州号 -
ccode2: 国家 2 的州号 -
year- 观察年份 -
DR_at_1- 在第 1 边的第 2 边的外交代表级别(见下文) -
DR_at_2- 第 1 方在第 2 方的外交代表级别(见下文) -
DE- 第一方和第二方之间的任何外交交流(见下文) -
version- 数据集的当前版本
# A tibble: 6 x 7
ccode1 ccode2 year DR_at_1 DR_at_2 DE version
<dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
1 2 20 1920 0 0 0 2006.
2 2 20 1925 0 0 0 2006.
3 2 20 1930 0 2 1 2006.
4 2 20 1935 2 2 1 2006.
5 2 20 1940 2 2 1 2006.
6 2 20 1950 9 9 1 2006.
我想要的不是这种表示形式:
country1
country2 1' 2' 3' 4' 5' 6'
1 0 1 0 0 0 0
2 1 0 1 0 0 0
3 0 0 0 0 1 1
4 1 0 1 0 1 1
5 0 1 0 0 0 1
6 0 0 1 0 1 0
请注意,此表中的值是假设值。
我是 R 新手,这就是为什么我对在这种情况下如何处理“年份”变量感到困惑。我的直觉是应该为每年单独构建邻接表,但我对其他建议持开放态度。
邻接表的值应基于 country2/1 在 country1/2 是否有外交代表处(DR_at_1 > 0 或 DR_at_2 > 0)。
我使用的数据可以在以下网址以可重复的方式定位:http://www.correlatesofwar.org/data-sets/diplomatic-exchange
提前谢谢你!
【问题讨论】:
标签: r dataframe matrix adjacency-matrix network-analysis