【问题标题】:R: How To Manipulate CSV Database [duplicate]R:如何操作 CSV 数据库 [重复]
【发布时间】:2016-08-02 06:36:05
【问题描述】:

我对 R 非常陌生,在网上研究和查阅我的教科书时,我无法完全回答这个问题。

因此,我有一个按国会选区细分的人口普查调查数据集,已上传到 R 中。但是,出于我的目的,我需要每个观察结果都是一个国会选区,每个人口统计数据点都显示为一个变量。因此,例如,不是阿拉巴马州的第一区为 E 列中的每个数据点出现 100 次 - 我希望它出现一次,E 列中的每个数据点都成为变量作为列。我还需要一种方法来使其适用于数据集中的其他 434 个地区。

这是它的大致示意图:

CD |变量 |数据 |

AL-1 |黑人人口 | 100,000 |

AL-1 |白人| 200,000 |

AL-1 |已婚人口 75,000 |

我希望它看起来像这样:

CD |黑人人口 |白人 |已婚人口 |

AL-1 | 100,000 | 200,000 | 75,000 |

关于如何实现这一点的任何想法,或者您可以指出我的良好学习资源?

【问题讨论】:

  • tidyr::spreaddata.table::dcastreshape2::dcaststats::reshape,如果我开始努力寻找,我可能会继续。

标签: r excel csv dataset


【解决方案1】:

这里是一个使用 reshape 函数的例子。正如 joran 指出的那样,有很多选择。

DF.long<-data.frame(state = rep(c("A","B","C","D"),each=3), type =c("XX","YY","ZZ"), value = rnorm(12))
DF.long

DF.wide<-reshape(DF.long,timevar = "type",idvar="state",direction="wide")
DF.wide

【讨论】:

  • 我看到我们不再标记重复项了
  • 这是一个调查这个问题的借口,因为我不太喜欢使用 R,我想我不妨把它贴出来。 Another duplicate 这里给出了一个更完整的答案,这里写得很好。
猜你喜欢
  • 2021-10-01
  • 2017-01-25
  • 1970-01-01
  • 1970-01-01
  • 2017-03-26
  • 2018-05-02
  • 2017-04-28
  • 2017-07-19
  • 1970-01-01
相关资源
最近更新 更多