【问题标题】:Categorize range of numeric column in R Using Revalue [duplicate]使用重值对R中数字列的范围进行分类[重复]
【发布时间】:2020-12-06 05:36:35
【问题描述】:

我正在尝试重新评估我的数据集中的列分数。在我检查了 Min、1st Qua、3rd Quad 和 Max 之后。我尝试将特定范围标记为以下代码

data2019$Score <-revalue(data2019$Score,c
("(2.853,4.553]" = "Not Happy", "(4.553,6.187]" = "Happy", "(6.187,7.769]" = "Flourishing"))

我不断收到 x 不是因子或字符向量的错误。 请注意这个问题

【问题讨论】:

  • 请提供可重现的示例以及预期的输出。阅读how to give a reproducible example。你可以试试dplyr::recode
  • @RonakShah 因为我有 Score 列,最小值是 2.853 到最大值 7.769。我分为 3 个不同的范围,并从低中到高分配每个范围。在我的情况下,不快乐,快乐和蓬勃发展。我 "(2.853,4.553]" = "不开心" "(4.553,6.187]" = "开心" "(6.187,7.769]" = "蓬勃发展"

标签: r mapping


【解决方案1】:

尝试将cutlabels 一起使用。

data2019$Group <- cut(data2019$Score, 3, 
                      labels = c("Not Happy", "Happy", "Flourishing"))

【讨论】:

  • 那么我只是为这些标签分配间隔?
  • 是的,或者您可以使用data2019$Interval &lt;- cut(data2019$Score, 3)获取间隔
猜你喜欢
  • 2023-03-24
  • 1970-01-01
  • 2017-10-11
  • 1970-01-01
  • 2020-02-03
  • 1970-01-01
  • 1970-01-01
  • 2019-09-26
  • 2018-06-22
相关资源
最近更新 更多