【发布时间】:2021-09-01 13:01:46
【问题描述】:
我有一个类似于以下的庞大数据集:
Df <- data.frame("Candidate ID" = c(1042, 1042, 1113, 1113, 1146, 1277, 1381, 1381, 1402, 1402),
"Application ID" = c(1040, 13006, 1111, 1125, 1144, 1274, 41, 61, 64, 65),
"Question" = c("Yes", "Yes", "No","Yes", "Yes","No", "No", "No","Yes", "No"))
背景:候选人可以申请多个职位申请,并且每次都会收到不同的申请 ID。一个应聘者 ID 最多可以申请 25 个工作申请,即申请 25 次不同的时间。在我的简化示例中,最大值是两个。
我想提取所有问题的答案都是“是”的候选人 ID。 在示例中,我想仅提取候选 ID 1042 和 1146。如何在 R 中执行此操作?
我在 StackOverflow 中进行了检查,但找不到匹配的答案,可能也是因为难以描述问题。至少我努力创建了一个可重现的最小示例,以便于帮助我。
【问题讨论】:
-
一些应该有帮助的帖子:stackoverflow.com/q/31661704/5325862stackoverflow.com/q/55012776/5325862 这是一个很难搜索的问题,但基本的
any或all函数应该很有用 -
谢谢大家的回答。这是我第一次写一个可重复的例子并收到这么多有用的回复。