【问题标题】:count factors in R build on BAZR中的计数因子建立在BAZ上
【发布时间】:2013-03-11 16:56:49
【问题描述】:

我有一个与counting unique factors in r 类似的问题,但是提供的解决方案不适用于我的数据。

我的数据是按药物组织的,专利信息作为变量包含在 df 中,而不是以患者为行单位。

               Sex        ID
drug x          F        Jane
drug x          F        Mary
drug x          M        Philip
drug x          F        Jane
drug x          F        Jane
drug x          M        Philip
drug x          M        John
drug x          M        Philip
drug x          F        Jane
drug x          M        Philip

我有 4 个唯一 ID,我想知道这 4 个 ID 的性别划分,应该是

F M
2 2

但我尝试的所有代码都会返回每种性别的药物数量,例如,

F M
5 5

有人可以帮我解决这个问题吗?当我使用以前的帮助时,我会得到一个唯一 ID 列表,其中性别列为 50。

【问题讨论】:

标签: r count r-factor


【解决方案1】:
> df
   sex     id
1    F   Jane
2    F   Mary
3    M Philip
4    F   Jane
5    F   Jane
6    M Philip
7    M   John
8    M Philip
9    F   Jane
10   M Philip

> summary(unique(df[,c('sex','id')])$sex)
F M 
2 2 

【讨论】:

  • 嗨,阿南达 - 非常感谢您的帮助!我试过你的代码,但无济于事。我的数据实际上是更大数据框(80,000 种药物和 100 名患者)的一部分。我制作了一个只有 ID 和性别的单独数据框,并尝试了您建议的代码,但 R 告诉我“'closure' 类型的对象不是子集的”。我不明白为什么我不能让 R 计算我唯一标识符列表中 F 或 M 的数量——这似乎是一件合乎逻辑的事情。
  • @SJS,如果此解决方案不适合您(它应该),您为什么不使用更准确的数据样本更新您的问题,您尝试过的一些特定代码,以及您在此过程中遇到的错误或问题。
  • 您好阿南达,感谢您的帮助。这是我的数据示例; > str(m1)[1:5] 'data.frame': 80903 obs。 50 个变量:$ drug_code:int 10020 10020 10020 10020 10020 10020 10020 10020 10020 10020 ... $ 性别:因子 w/ 2 个级别“F”,“M”:2 1 1 2 1 1 2 1 1 2 ... $ ID:因子 w/100 级别“患者 1230056694”,..:45 62 62 45 62 62 45 62 62 45 ...这是我尝试过的代码
  • 等一下----成功了!我使用了表(唯一(m1[c("sex","ID")])$sex)。非常感谢你的帮助和鼓励——当我回信给你时,我尝试了更多的东西——所以谢谢!期待更好地学习 R,以便我可以在某个阶段帮助某人。再次感谢阿南达。
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2017-04-24
  • 2017-08-23
  • 2014-06-12
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多