从文本

时间:2017-03-31 14:04:01

标签: r

我有一个包含许多行的列,其中包含以下地理信息:

Ø228818,N6575807 Sone 33(±500m)UTM(WGS 84)

这些都合并在一个列中,只用“,”和“”分隔。 我需要将“Sone XX”提取到一个自己的列中,但我没有找到任何合适的命令。 有什么建议吗?

1 个答案:

答案 0 :(得分:0)

您可以使用sub和正则表达式来获取此内容。

NewColumn = sub(".*\\b(Sone\\s+\\d+).*", "\\1", String)
NewColumn
[1] "Sone 33"

RegEx的一些细节

中间部分Sone\\s+\\d+是你想要的。
Sone是文字字符串。 \\s+匹配一个或多个空格。 \\d+匹配一个或多个数字0-9。该组括在括号中,以便存储结果供以后使用。该模式之前和之后是\\.*以匹配其他所有内容。