如何用R中的字符串字符替换int值范围

时间:2020-04-10 09:40:15

标签: r dataframe replace integer multiple-conditions

我想根据条件用字符串字符替换整数值范围。

例如,我有一个数据框

    Gender   Grade   Indus 
  1      1     610     15    
  2      1     110     29     
  3      2     210     32     
  4      1     250     20   
  5      2     420     37   
  6      2     430     19
  7      1     450     25

我想根据以下条件用一些字符串字符替换“等级”列中的值:

prima =c(110,210:250,610)
secon =c(420,440:460)
vocat =c(430,470)

例如,如果“成绩”中的数字为prima,例如,如果Grade == 610,我想将数字更改为单词“ Primary”。

我尝试过使用...

mydf$Grade[mydf$Grade == prima] <- "Primary"
mydf$Grade[mydf$Grade == secon] <- "Secondary"
mydf$Grade[mydf$Grade == vocat] <- "Vocational"

但是它不起作用。它没有返回错误,但是只有极少数的值更改为“ Primary”或“ Secondary”,而其他许多数字保持不变。

我也尝试过...

for (i in mydf$Grade) {
    if (i %in% prima) mydf$Grade <- "Primary"
    else if (i %in% secon) mydf$Grade <- "Secondary"
    else if (I %in% vocat) mydf$Grade <- "Vocational"
}

这也不起作用。 “等级”中的所有值都改为“主要”。 我曾尝试使用这两种方法处理真实数据,但我还必须循环使用10年以上。

我不知道我做错了什么。我已经尝试过这些方法,但是当我想用NaN代替它时它就起作用了。但是,当我想用​​其他整数或字符串字符替换时,它不起作用。 任何建议将不胜感激。

1 个答案:

答案 0 :(得分:1)

==进行逐元素比较。由于我们要在此处比较多个元素,因此请使用%in%

mydf$Grade[mydf$Grade %in% prima] <- "Primary"
mydf$Grade[mydf$Grade %in% secon] <- "Secondary"
mydf$Grade[mydf$Grade %in% vocat] <- "Vocational"

或使用dplyr::case_when

library(dplyr)
mydf %>%
  mutate(Grade = case_when(Grade %in% prima ~ "Primary", 
                           Grade %in% secon ~ "Secondary", 
                           Grade %in% vocat ~ "Vocational"))


#  Gender      Grade Indus
#1      1    Primary    15
#2      1    Primary    29
#3      2    Primary    32
#4      1    Primary    20
#5      2  Secondary    37
#6      2 Vocational    19
#7      1  Secondary    25

数据

mydf <- structure(list(Gender = c(1L, 1L, 2L, 1L, 2L, 2L, 1L), Grade = c(610L, 
110L, 210L, 250L, 420L, 430L, 450L), Indus = c(15L, 29L, 32L, 
20L, 37L, 19L, 25L)), class = "data.frame", row.names = c(NA, -7L))
相关问题