查找R中所有列相等的行

时间:2014-10-24 20:14:29

标签: r colors dataframe subset

我在R中有一个data.frame.data.frame有三列:R,G,B代表红色,绿色和蓝色代码。我想用“灰色”颜色过滤所有行,其中R == G == B.这是我的代码:

    red <- c("30", "68", "28", "60", "90", "40", "10", "C8", "88", "38", 
  "08", "00", "D8", "20", "F8", "18", "B0", "F8", "A8", "F8", "F8", 
  "F8", "F8", "F8", "F8", "F8", "F8", "F8", "F8", "F8", "F8", "F8", 
  "F8", "F8", "F8", "F8", "F8", "D8", "F8", "F8", "E8", "F8", "B8", 
  "F8", "F8", "C8", "E8", "B0", "98", "E0", "F8", "F8", "78", "90", 
  "68", "A8", "D0", "88", "F8", "48", "F8", "60", "30", "80", "58", 
  "C0", "F8", "08", "28", "50", "00", "20", "A0", "00", "18", "70", 
  "00", "00", "00", "40", "F0", "70", "00", "00", "00", "00", "00", 
  "00", "F8", "F8", "F0", "F8", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00")

  green <- c("30", "68", "28", "60", "90", "40", "10", "C8", "88", "38", 
  "08", "00", "D8", "20", "28", "18", "B0", "08", "A8", "58", "20", 
  "70", "88", "38", "18", "50", "B0", "68", "98", "80", "48", "D0", 
  "A8", "10", "C8", "40", "E8", "F8", "78", "A0", "F8", "C0", "F8", 
  "E0", "30", "F8", "E8", "F8", "F8", "F8", "90", "D8", "F8", "F8", 
  "F8", "F8", "F8", "F8", "00", "F8", "B8", "F8", "F8", "F8", "F8", 
  "F8", "60", "F8", "F8", "F8", "F0", "F8", "F8", "E8", "F8", "F8", 
  "D8", "A8", "C8", "F8", "F8", "70", "80", "B8", "98", "68", "F8", 
  "48", "F8", "F0", "F0", "F8", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00")

  blue <- c("30", "68", "28", "60", "90", "40", "10", "C8", "88", "38", 
  "08", "00", "D8", "20", "00", "18", "B0", "00", "A8", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "E8", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "08", "00", "00", "10", "00", "00", 
  "20", "50", "30", "00", "00", "70", "78", "40", "60", "90", "00", 
  "B0", "00", "00", "F0", "F8", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", "00", 
  "00", "00", "00", "00")

  RGB <- data.frame("R"=red, "G"=green, "B"=blue)
  grays <- subset(RGB,(R==G & R==B & G==B))

但是在最后一个命令中我得到一个错误:Error in Ops.factor(R, B) : level sets of factors are different

我也尝试了子集化命令:

grays2 <- RGB[(RGB$R==RGB$G & RGB$R==RGB$B & RGB$G==RGB$B),]

但它给了我同样的错误信息。

我在这里做错了什么?

2 个答案:

答案 0 :(得分:2)

如果您愿意尝试使用data.table,则代码会更短。仍需要在评论中设置stringsAsFactors = F。

RGB <- data.frame("R"=red, "G"=green, "B"=blue, stringsAsFactors=F)
library(data.table)
setDT(RGB)  ## set data frame to data table
grays_dt <- RGB[c(R==G & R==B & G==B), ]  ## do the subsetting
grays_dt
#     R  G  B
# 1: 30 30 30
# 2: 68 68 68
# 3: 28 28 28
# 4: 60 60 60
# 5: 90 90 90
# ---         
# 181: 00 00 00
# 182: 00 00 00
# 183: 00 00 00
# 184: 00 00 00
# 185: 00 00 00

@ Mark的解决方案与此解决方案之间的区别在于,列类是基础解决方案中的因子,而是data.table解决方案中的字符。

str(grays_dt)
# Classes ‘data.table’ and 'data.frame':  185 obs. of  3 variables:
# $ R: chr  "30" "68" "28" "60" ...
# $ G: chr  "30" "68" "28" "60" ...
# $ B: chr  "30" "68" "28" "60" ...
# - attr(*, ".internal.selfref")=<externalptr> 

str(grays)
# 'data.frame': 185 obs. of  3 variables:
# $ R: Factor w/ 21 levels "00","08","10",..: 7 11 6 10 14 9 3 17 13 8 ...
# $ G: Factor w/ 21 levels "00","08","10",..: 7 11 6 10 14 9 3 17 13 8 ...
# $ B: Factor w/ 21 levels "00","08","10",..: 7 11 6 10 14 9 3 17 13 8 ...

答案 1 :(得分:1)

试试这个:

grayIndexes <-which(red==green & green==blue & red==green)
grays <- data.frame("R"=red[grayIndexes], 
                    "G"=green[grayIndexes], 
                    "B"=blue[grayIndexes])

如果你对那些有颜色的人感兴趣:

colourIndexes <-which(!(red==green & green==blue & red==green))
colours <- data.frame("R"=red[colourIndexes], 
                      "G"=green[colourIndexes],
                      "B"=blue[colourIndexes])