R：如何操作 CSV 数据库 [重复]答案

【问题标题】：R: How To Manipulate CSV Database [duplicate]R：如何操作 CSV 数据库 [重复]
【发布时间】：2016-08-02 06:36:05
【问题描述】：

我对 R 非常陌生，在网上研究和查阅我的教科书时，我无法完全回答这个问题。

因此，我有一个按国会选区细分的人口普查调查数据集，已上传到 R 中。但是，出于我的目的，我需要每个观察结果都是一个国会选区，每个人口统计数据点都显示为一个变量。因此，例如，不是阿拉巴马州的第一区为 E 列中的每个数据点出现 100 次 - 我希望它出现一次，E 列中的每个数据点都成为变量作为列。我还需要一种方法来使其适用于数据集中的其他 434 个地区。

这是它的大致示意图：

CD |变量 |数据 |

AL-1 |黑人人口 | 100,000 |

AL-1 |白人| 200,000 |

AL-1 |已婚人口 75,000 |

我希望它看起来像这样：

CD |黑人人口 |白人 |已婚人口 |

AL-1 | 100,000 | 200,000 | 75,000 |

关于如何实现这一点的任何想法，或者您可以指出我的良好学习资源？

【问题讨论】：

tidyr::spread，data.table::dcast，reshape2::dcast，stats::reshape，如果我开始努力寻找，我可能会继续。

标签： r excel csv dataset

【解决方案1】：

这里是一个使用 reshape 函数的例子。正如 joran 指出的那样，有很多选择。

DF.long<-data.frame(state = rep(c("A","B","C","D"),each=3), type =c("XX","YY","ZZ"), value = rnorm(12))
DF.long

DF.wide<-reshape(DF.long,timevar = "type",idvar="state",direction="wide")
DF.wide

【讨论】：

我看到我们不再标记重复项了
这是一个调查这个问题的借口，因为我不太喜欢使用 R，我想我不妨把它贴出来。 Another duplicate 这里给出了一个更完整的答案，这里写得很好。