【发布时间】:2016-08-02 06:36:05
【问题描述】:
我对 R 非常陌生,在网上研究和查阅我的教科书时,我无法完全回答这个问题。
因此,我有一个按国会选区细分的人口普查调查数据集,已上传到 R 中。但是,出于我的目的,我需要每个观察结果都是一个国会选区,每个人口统计数据点都显示为一个变量。因此,例如,不是阿拉巴马州的第一区为 E 列中的每个数据点出现 100 次 - 我希望它出现一次,E 列中的每个数据点都成为变量作为列。我还需要一种方法来使其适用于数据集中的其他 434 个地区。
这是它的大致示意图:
CD |变量 |数据 |
AL-1 |黑人人口 | 100,000 |
AL-1 |白人| 200,000 |
AL-1 |已婚人口 75,000 |
我希望它看起来像这样:
CD |黑人人口 |白人 |已婚人口 |
AL-1 | 100,000 | 200,000 | 75,000 |
关于如何实现这一点的任何想法,或者您可以指出我的良好学习资源?
【问题讨论】:
-
tidyr::spread,data.table::dcast,reshape2::dcast,stats::reshape,如果我开始努力寻找,我可能会继续。