【发布时间】:2021-09-07 06:41:39
【问题描述】:
以下是示例数据。手头的任务是创建两个新列,它们将通过邮政编码指定某些东西。第一个新列的标题是 Las_Vegas,第二个是 Laughlin。对于 Las Vegas,前八个邮政编码的值为 1,对于 Laughlin,后八个邮政编码的值为 1。这样做的目的是想总结一下拉斯维加斯和劳克林的就业情况。
第一个问题:使用 ifelse 还是 case_when 最好? 第二个问题:将两个新列变成事实上的虚拟变量……这是最好的方法吗?
zipcode <-c(89102,89103,89104,89105,89106,89107,89108,89109,89110,89111,89112,89113,89114,89115,89116,89117)
naicstest<-c(541213,541213,541213,541213,541213,541213,541213,541213,541213,541213,541213,541213,541213,541212,541215,541214)
emptest <-c(2,4,6,8,10,12,14,16,18,20,22,24,26,28,30,32)
county <- data.frame(zipcode,naicstest,emptest)
最终结果。这个最终结果将有 16 行。为了简单起见,我保持简短。 Las_Vegas 为 1 行,Laughlin 为 1 行,但 Las_Vegas 为 8 行,Laughlin 为 8 行。我知道如何进行总结(总结就业),但很难做到这两列。
zipcode naicstest emptest Las_Vegas Laughlin
89102 541213 2 1 0
89110 541213 18 0 1
【问题讨论】:
标签: r if-statement dplyr case-when