在字符串中查找字符的位置

时间:2013-01-10 01:44:08

标签: regex string r

我想在字符串中找到字符的位置。

说:string = "the2quickbrownfoxeswere2tired"

我希望该函数返回424 - 2string的字符位置。

6 个答案:

答案 0 :(得分:103)

您可以使用gregexpr

 gregexpr(pattern ='2',"the2quickbrownfoxeswere2tired")


[[1]]
[1]  4 24
attr(,"match.length")
[1] 1 1
attr(,"useBytes")
[1] TRUE
来自包str_locate_all

或者stringr,它是 gregexpr stringi::stri_locate_all的包装(从stringr版本1.0开始)

library(stringr)
str_locate_all(pattern ='2', "the2quickbrownfoxeswere2tired")

[[1]]
     start end
[1,]     4   4
[2,]    24  24

请注意,您只需使用stringi

即可
library(stringi)
stri_locate_all(pattern = '2', "the2quickbrownfoxeswere2tired", fixed = TRUE)

基地R中的另一个选项就像是

lapply(strsplit(x, ''), function(x) which(x == '2'))

应该有效(给定一个字符向量x

答案 1 :(得分:32)

这是另一种直截了当的选择。

> which(strsplit(string, "")[[1]]=="2")
[1]  4 24

答案 2 :(得分:16)

你可以使用unlist:

使输出只有4和24
unlist(gregexpr(pattern ='2',"the2quickbrownfoxeswere2tired"))
[1]  4 24

答案 3 :(得分:2)

在str1中找到第n次出现str2的位置(与Oracle SQL INSTR相同的参数顺序),如果找不到则返回0

instr <- function(str1,str2,startpos=1,n=1){
    aa=unlist(strsplit(substring(str1,startpos),str2))
    if(length(aa) < n+1 ) return(0);
    return(sum(nchar(aa[1:n])) + startpos+(n-1)*nchar(str2) )
}


instr('xxabcdefabdddfabx','ab')
[1] 3
instr('xxabcdefabdddfabx','ab',1,3)
[1] 15
instr('xxabcdefabdddfabx','xx',2,1)
[1] 0

答案 4 :(得分:2)

要仅找到第一个位置,请将lapply()min()一起使用:

my_string <- c("test1", "test1test1", "test1test1test1")

unlist(lapply(gregexpr(pattern = '1', my_string), min))
#> [1] 5 5 5

# or the readable tidyverse form
my_string %>%
  gregexpr(pattern = '1') %>%
  lapply(min) %>%
  unlist()
#> [1] 5 5 5

要仅找到最后个位置,请将lapply()max()一起使用:

unlist(lapply(gregexpr(pattern = '1', my_string), max))
#> [1]  5 10 15

# or the readable tidyverse form
my_string %>%
  gregexpr(pattern = '1') %>%
  lapply(max) %>%
  unlist()
#> [1]  5 10 15

答案 5 :(得分:1)

您也可以使用grep

grep('2', strsplit(string, '')[[1]])
#4 24