仅从字符串中提取浮点数

时间:2014-11-14 07:09:21

标签: regex r xpath

我需要从这样的标签中只抓取并且只有浮动(这些是地理坐标)

   tag = <span id="o_4050267" class="np" style="color:green;cursor:pointer;border-bottom: 1px dotted;" onclick="_gaq.push(['_trackEvent', 'goal', 'click', 'map']);init('4050267','37.61909100','55.85712900','37.604843 55.863384','flat2',1,15);">blahblah</span>

我尝试使用gsub("[^0-9]+.[^0-9]+", "/", tag),然后strsplit()每次拾取第4和第5个元素时,但当然会刮掉4000多页非常规页面,有时根本没有对象的坐标,或者有时会有更多,代码选择错误的数字,例如span's id,用于示例。而且,我只需要抓住第一对坐标,第二对不是我感兴趣的。

或许有一种方法可以使用此标记,而不是使用字符串,但使用XPath表达式?不幸的是,我不知道有可能使用xpath来获取信息,而不是在标签之间,而是在内部。

提前致谢!

1 个答案:

答案 0 :(得分:0)

\b\d+\.\d+\b

试试这个。看看演示。

http://regex101.com/r/pQ9bV3/23

相关问题