部分匹配时忽略特殊的土耳其语字符

时间:2019-07-10 20:45:59

标签: r grep

假设我们有一个“ AMID DIMAD YUZBASIOGLU”字符串。我想做的是使用grep函数将可能的字符串(例如“AMİDYÜZBAŞIOĞLU”,“ AMIDYÜZBAŞIOĞLU”,“ AMIDDİMADYÜZBAŞIOĞLU”)与“ AMID DIMAD YUZBASIOGLU”进行匹配。

1 个答案:

答案 0 :(得分:1)

我们可以使用iconv(your_string, to='ASCII//TRANSLIT')将特殊字符转换为'ASCII',然后使用grep

> x <- "AMID DIMAD YUZBASIOGLU" 
> string <- c("AMİD YÜZBAŞIOĞLU","AMID YÜZBAŞIOĞLU","AMID DİMAD YÜZBAŞIOĞLU")
> y <- iconv(string, to='ASCII//TRANSLIT')
> grep(x, y)
[1] 3
相关问题