【问题标题】:How to subset my data with eliminating repeated observations如何通过消除重复观察来对我的数据进行子集化
【发布时间】:2014-05-20 13:45:00
【问题描述】:

如何消除对 IGM 的重复观察?我想将以下数据作为每个县一个 IGM。

我试过了

    data$GM[data$county]

但它不起作用,因为我需要 [] 内的行号,而不是县号。我如何才能每个县匹配一位 GM?

要清楚, 我想做这个数据

   county cd110 repvote   state  GM  gini
2    1001   102       1 Alabama 38.4 0.381
3    1001   102       1 Alabama 38.4 0.381
4    1003   101       0 Alabama 39.6 0.491
5    1003   101       0 Alabama 39.6 0.491
9    1003   101       0 Alabama 39.6 0.491
13   1003   101       1 Alabama 39.6 0.491

到以下数据。

  county cd110 repvote   state  GM  gini
   1001   102       1 Alabama 38.4 0.381
   1003   101       0 Alabama 39.6 0.491

谢谢。

【问题讨论】:

  • 您的问题不是很清楚,但请参阅duplicatedunique 函数。

标签: r subset


【解决方案1】:

您可以使用duplicated 函数获取每个县的第一个观测值:

dat[!duplicated(dat$county),]
#   county cd110 repvote   state   GM  gini
# 2   1001   102       1 Alabama 38.4 0.381
# 4   1003   101       0 Alabama 39.6 0.491

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2020-11-07
    • 1970-01-01
    • 2018-10-29
    • 1970-01-01
    • 1970-01-01
    • 2018-08-16
    相关资源
    最近更新 更多