如何匹配给定HTML标记内的数字?

时间:2009-07-02 07:45:06

标签: regex

我想匹配HTML标记内的数字,例如:

Sometext<sometag><htmltag>123123</htmltag></sometag>

我想创建一个正则表达式,找到我选择的HTML标记内的数字,例如123123内的<htmltag>

2 个答案:

答案 0 :(得分:3)

不,您不需要“匹配”,您需要提取HTML节点。使用HTML解析器。 HTML解析器使用起来更简单,对更改更加健壮,并且更容易扩展(例如,抓取同一文档的更多部分)。另一方面,正则表达式只是错误的工具,因为 HTML不是常规语言

答案 1 :(得分:1)

如果这两个标签之间只有数字,绝对没有空格或任何东西,你只需使用这个正则表达式:

/<htmltag>([0-9]+)<\/htmltag>/

或者,如果可能有空格:

/<htmltag>\s*([0-9]+)\s*<\/htmltag>/
相关问题