在R中提取文本

时间:2013-03-26 06:36:13

标签: regex r text extract substr

我正在尝试使用R提取文本的可变长度子字符串。我有几个字符,如下所示:

"\"/Users/Nel/Documents/Project/Data/dataset.csv\""

我需要从每个这样的角色中提取文件路径。在这种情况下,我想要得到的是:

path1 <- "/Users/Nel/Documents/Project/Data/dataset.csv"

我可以使用子字符串函数:

path1 <- substr("\"/Users/Nel/Documents/Project/Data/dataset.csv\"", 3, 46)

使用索引进行硬编码以获得我在此特定实例中所需的内容。但是,这个特定的路径是众多路径中的一个,我需要能够动态地找到这些索引。我相信

grep()

函数可以工作,但我无法弄清楚相关的正则表达式。感谢。

1 个答案:

答案 0 :(得分:3)

您似乎只是想删除一些硬编码的引号。

尝试gsub

x
# [1] "\"/Users/Nel/Documents/Project/Data/dataset.csv\""
gsub('\"',"",x)
# [1] "/Users/Nel/Documents/Project/Data/dataset.csv"
## or 
# gsub('["]', "", x)