从字母数字字符中删除数字

时间:2012-11-27 17:52:17

标签: regex r

我有一个字母数字字符列表,如下所示:

x <-c('ACO2', 'BCKDHB456', 'CD444')

我想要以下输出:

x <-c('ACO', 'BCKDHB', 'CD')

有什么建议吗?

# dput(tmp2)

structure(c(432L, 326L, 217L, 371L, 179L, 182L, 188L, 268L, 255L,..., 
), class = "factor")

4 个答案:

答案 0 :(得分:59)

您可以使用gsub

gsub('[[:digit:]]+', '', x)

gsub('[0-9]+', '', x)
# [1] "ACO"    "BCKDHB" "CD" 

答案 1 :(得分:5)

使用stringr

大多数字符串函数处理正则表达式

str_replace_all将满足您的需求

str_replace_all(c('ACO2', 'BCKDHB456', 'CD444'), "[:digit:]", "")

答案 2 :(得分:4)

使用stringi的解决方案:

# your data
x <-c('ACO2', 'BCKDHB456', 'CD444')

# extract capital letters
x <- stri_extract_all_regex(x, "[A-Z]+")

# unlist, so that you have a vector
x <- unlist(x)

一行解决方案:

Screenshot on-liner in R

答案 3 :(得分:3)

如果您的目标只是删除数字,则removeNumbers()函数会从文本中删除数字。使用它可以降低出错的风险。

library(tm)

x <-c('ACO2', 'BCKDHB456', 'CD444') 

x <- removeNumbers(x)

x

[1] "ACO"    "BCKDHB" "CD"