【问题标题】:Find rows where all columns are equal in R在R中查找所有列都相等的行
【发布时间】:2023-04-09 23:37:01
【问题描述】:

我在 R 中有一个 data.frame。data.frame 有三列:R、G、B,分别代表红色、绿色和蓝色的颜色代码。我想用“灰色”颜色过滤所有行,其中 R == G == B。这是我的代码:

    red <- c("30", "68", "28", "60", "90", "40", "10", "C8", "88", "38", 
  "08", "00", "D8", "20", "F8", "18", "B0", "F8", "A8", "F8", "F8", 
  "F8", "F8", "F8", "F8", "F8", "F8", "F8", "F8", "F8", "F8", "F8", 
  "F8", "F8", "F8", "F8", "F8", "D8", "F8", "F8", "E8", "F8", "B8", 
  "F8", "F8", "C8", "E8", "B0", "98", "E0", "F8", "F8", "78", "90", 
  "68", "A8", "D0", "88", "F8", "48", "F8", "60", "30", "80", "58", 
  "C0", "F8", "08", "28", "50", "00", "20", "A0", "00", "18", "70", 
  "00", "00", "00", "40", "F0", "70", "00", "00", "00", "00", "00", 
  "00", "F8", "F8", "F0", "F8", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00")

  green <- c("30", "68", "28", "60", "90", "40", "10", "C8", "88", "38", 
  "08", "00", "D8", "20", "28", "18", "B0", "08", "A8", "58", "20", 
  "70", "88", "38", "18", "50", "B0", "68", "98", "80", "48", "D0", 
  "A8", "10", "C8", "40", "E8", "F8", "78", "A0", "F8", "C0", "F8", 
  "E0", "30", "F8", "E8", "F8", "F8", "F8", "90", "D8", "F8", "F8", 
  "F8", "F8", "F8", "F8", "00", "F8", "B8", "F8", "F8", "F8", "F8", 
  "F8", "60", "F8", "F8", "F8", "F0", "F8", "F8", "E8", "F8", "F8", 
  "D8", "A8", "C8", "F8", "F8", "70", "80", "B8", "98", "68", "F8", 
  "48", "F8", "F0", "F0", "F8", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00")

  blue <- c("30", "68", "28", "60", "90", "40", "10", "C8", "88", "38", 
  "08", "00", "D8", "20", "00", "18", "B0", "00", "A8", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "E8", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "08", "00", "00", "10", "00", "00", 
  "20", "50", "30", "00", "00", "70", "78", "40", "60", "90", "00", 
  "B0", "00", "00", "F0", "F8", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00")

  RGB <- data.frame("R"=red, "G"=green, "B"=blue)
  grays <- subset(RGB,(R==G & R==B & G==B))

但是在最后一个命令中我得到一个错误:Error in Ops.factor(R, B) : level sets of factors are different

我也尝试了子集命令:

grays2 <- RGB[(RGB$R==RGB$G & RGB$R==RGB$B & RGB$G==RGB$B),]

但它给了我同样的错误信息。

我在这里做错了什么?

【问题讨论】:

  • 尝试将RGBstringsAsFactors=FALSE...
  • 最小可重现示例
  • RGB &lt;- data.frame("R"=red, "G"=green, "B"=blue, stringsAsFactors=FALSE) 工作!我不知道为什么,但它解决了我的问题。

标签: r colors dataframe subset


【解决方案1】:

如果您愿意尝试 data.table,代码会更短。仍然需要在 cmets 中设置 stringsAsFactors=F。

RGB <- data.frame("R"=red, "G"=green, "B"=blue, stringsAsFactors=F)
library(data.table)
setDT(RGB)  ## set data frame to data table
grays_dt <- RGB[c(R==G & R==B & G==B), ]  ## do the subsetting
grays_dt
#     R  G  B
# 1: 30 30 30
# 2: 68 68 68
# 3: 28 28 28
# 4: 60 60 60
# 5: 90 90 90
# ---         
# 181: 00 00 00
# 182: 00 00 00
# 183: 00 00 00
# 184: 00 00 00
# 185: 00 00 00

@Mark 的解决方案和这个解决方案的区别在于,列类在基础解决方案中是 Factor,而在 data.table 解决方案中是 Character。

str(grays_dt)
# Classes ‘data.table’ and 'data.frame':  185 obs. of  3 variables:
# $ R: chr  "30" "68" "28" "60" ...
# $ G: chr  "30" "68" "28" "60" ...
# $ B: chr  "30" "68" "28" "60" ...
# - attr(*, ".internal.selfref")=<externalptr> 

str(grays)
# 'data.frame': 185 obs. of  3 variables:
# $ R: Factor w/ 21 levels "00","08","10",..: 7 11 6 10 14 9 3 17 13 8 ...
# $ G: Factor w/ 21 levels "00","08","10",..: 7 11 6 10 14 9 3 17 13 8 ...
# $ B: Factor w/ 21 levels "00","08","10",..: 7 11 6 10 14 9 3 17 13 8 ...

【讨论】:

    【解决方案2】:

    试试这个:

    grayIndexes <-which(red==green & green==blue & red==green)
    grays <- data.frame("R"=red[grayIndexes], 
                        "G"=green[grayIndexes], 
                        "B"=blue[grayIndexes])
    

    如果你对有颜色的感兴趣:

    colourIndexes <-which(!(red==green & green==blue & red==green))
    colours <- data.frame("R"=red[colourIndexes], 
                          "G"=green[colourIndexes],
                          "B"=blue[colourIndexes])
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2022-12-05
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2013-09-19
      • 2018-05-27
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多