【发布时间】:2020-08-18 04:58:42
【问题描述】:
我有一组具有各种名称的大学的数据集,例如“x 学院”、“x 大学”和“x 社区学院”,需要按学院、社区学院或大学的分类对它们进行分组。
然后按州组织它们。共有 5 行:姓名、地点、两种类型的学费以及私人或公共。
我试过这个: typeSchool
但它没有奏效。寻找建议。
我是否应该尝试改变变量并为每个分类添加一个单独的变量,然后 group_by(classification)?
示例行:
是否也可以为此使用 grep 形式?
structure(list(Name = structure(c(5L, 1L, 6L, 4L, 3L, 2L), .Label = c("Bard College",
“布朗大学”、“康涅狄格学院”、“达特茅斯学院”、 "Landmark College", "St. John's College"), class= "factor"), 位置 = 结构(c(5L,1L,6L,2L,3L,4L),.Label = c(“ANNANDALE-ON-HUDSON,NY”, “新罕布什尔州汉诺威”、“康涅狄格州新伦敦”、“罗德岛普罗维登斯”、“佛蒙特州普特尼”、 “圣达菲,NM”),class=“因子”),In.State.Tuition = c(50080L, 49906L, 49644L, 49506L, 49350L, 49346L), Out.of.State.Tuition = c(50080L, 49906L, 49644L, 49506L, 49350L, 49346L), 类型 = 结构(c(1L, 1L, 1L, 1L, 1L, 1L), .Label = "Private", class= "factor")), row.names = c(NA, -6L), class= c("tbl_df", "tbl", "data.frame"))
【问题讨论】:
-
问题是 'words' 不是数据集中的列名。不确定您正在尝试哪一列。
Name是具有“College”子字符串的一列。因此,插入“单词”,应将其更改为“名称”
标签: r