帮助正则表达式

时间:2010-10-24 18:49:02

标签: html regex

如何匹配锚标记之外的文本?例如:"test <a>test</a>"我想仅在a标签之外进行测试。

感谢。

2 个答案:

答案 0 :(得分:4)

在大多数情况下,尝试使用正则表达式解析HTML / XML是不可行的。解析标记不是一种选择吗?

答案 1 :(得分:0)

您需要使用前瞻性正则表达式。这些可能非常复杂。有关此主题的更多信息,请参阅此页面:http://www.regular-expressions.info/refadv.html

对于你的简单例子,像这样的东西可以解决这个问题:

/test(?=<a>test<\/a>)/

然而,如果您需要匹配更多不同的HTML,它将变得非常非常复杂,以至于如果您不知道输入HTML如何可能几乎不可能正确将被格式化。

因此,从长远来看,您可能会发现使用DOM解析器在HTML文档中查找文本会更好。