如何通过消除重复观察来对我的数据进行子集化答案

【问题标题】：How to subset my data with eliminating repeated observations如何通过消除重复观察来对我的数据进行子集化
【发布时间】：2014-05-20 13:45:00
【问题描述】：

如何消除对 IGM 的重复观察？我想将以下数据作为每个县一个 IGM。

我试过了

    data$GM[data$county]

但它不起作用，因为我需要 [] 内的行号，而不是县号。我如何才能每个县匹配一位 GM？

要清楚，我想做这个数据

   county cd110 repvote   state  GM  gini
2    1001   102       1 Alabama 38.4 0.381
3    1001   102       1 Alabama 38.4 0.381
4    1003   101       0 Alabama 39.6 0.491
5    1003   101       0 Alabama 39.6 0.491
9    1003   101       0 Alabama 39.6 0.491
13   1003   101       1 Alabama 39.6 0.491

到以下数据。

  county cd110 repvote   state  GM  gini
   1001   102       1 Alabama 38.4 0.381
   1003   101       0 Alabama 39.6 0.491

谢谢。

【问题讨论】：

您的问题不是很清楚，但请参阅duplicated 和unique 函数。

标签： r subset

【解决方案1】：

您可以使用duplicated 函数获取每个县的第一个观测值：

dat[!duplicated(dat$county),]
#   county cd110 repvote   state   GM  gini
# 2   1001   102       1 Alabama 38.4 0.381
# 4   1003   101       0 Alabama 39.6 0.491

【讨论】：