match()与%运算符中的%

时间:2015-01-23 06:20:36

标签: r match

从我在?match()

中读到的内容
  

“%in%”< - function(x,table)match(x,table,nomatch = 0)> 0

为什么我使用match(x, dict[["word"]], 0L)

获得不同的结果
vapply(strsplit(df$text, " "), 
   function(x) sum(dict[["score"]][match(x, dict[["word"]], 0L)]), 1)
#[1]  2 -2  3 -2

使用dict[["word"]] %in% x时的对比

vapply(strsplit(df$text, " "), 
       function(x) sum(dict[["score"]][dict[["word"]] %in% x]), 1)
#[1]  2 -2  1 -1

数据

library(dplyr)
df <- data_frame(text = c("I love pandas", "I hate monkeys", 
                          "pandas pandas pandas", "monkeys monkeys"))
dict <- data_frame(word = c("love", "hate", "pandas", "monkeys"),
                   score = c(1,-1,1,-1))

更新

在理查德的解释之后,我现在理解了我最初的误解。 %in%运算符返回逻辑向量:

> sapply(strsplit(df$text, " "), function(x) dict[["word"]] %in% x)
      [,1]  [,2]  [,3]  [,4]
[1,]  TRUE FALSE FALSE FALSE
[2,] FALSE  TRUE FALSE FALSE
[3,]  TRUE FALSE  TRUE FALSE
[4,] FALSE  TRUE FALSE  TRUE

match()返回位置编号:

> sapply(strsplit(df$text, " "), function(x) match(x, dict[["word"]], 0L))
[[1]]
[1] 0 1 3

[[2]]
[1] 0 2 4

[[3]]
[1] 3 3 3

[[4]]
[1] 4 4

1 个答案:

答案 0 :(得分:5)

match()返回第一个匹配位置的整数向量,如果该位置不是第一个匹配则为1。

%in%返回一个逻辑向量,其中匹配(TRUE)始终 1(表示为整数时)。

因此,计算中的总和可能会有所不同。