如何从文本中提取数字?

时间:2016-11-22 14:28:22

标签: r character strsplit

我有流动的文字字符串:

string <- "['CBOE SHORT-TERM VIX FUTURE DEC 2016', 81.64],\n\n    ['CBOE SHORT-TERM VIX FUTURE JAN 2017', 18.36]"

有一种从文本中提取数字元素的简单方法,而不必使用:

string_table <- strsplit(string, " ")

然后选择第n个元素并继续strsplit直到我拥有我需要的东西。

结果应该是:

result <- c(2016, 81, 64, 2017, 18, 36)
谢谢你。

1 个答案:

答案 0 :(得分:5)

我们可以通过将模式指定为一个或多个数字(str_extract_all)来使用[0-9]+。输出为长度为1的list,使用[[提取向量并转换为numeric

library(stringr)
as.numeric(str_extract_all(string, "[0-9]+")[[1]])
#[1] 2016   81   64 2017   18   36

如果我们使用的是strsplit,请使用非数字字符

进行拆分
as.numeric(strsplit(string, "\\D+")[[1]][-1])
#[1] 2016   81   64 2017   18   36